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Editoriale 


Gianfranco Barbieri 
Direttore di 
"Elettronica e Telecomunicazioni" 


Questo numero si apre con la notizia dell'assegna¬ 
zione alla Rai, per il secondo anno consecutivo, del 
Premio sulla convergenza nell'ICMT (Information, 
Communìcatìon & Media Technology). Il riconosci¬ 
mento in oggetto, promosso da Confindustria 
Servizi Innovativi e Tecnologici neN'ambito del 
Premio Imprese per l'Innovazione, è stato tributato 
per il progetto Rai-h ; il progetto, sviluppato dalla 
Direzione Strategie Tecnologiche con il Centro Ri¬ 
cerche Rai, si inquadra nel filone dei nuovi servizi 
in cui l'utente passa da una fruizione meramente 
"passiva"ad una più "attiva", basata sull'interazione 
con altri dispositivi tecnologici. Il Centro Ricerche e 
Innovazione tecnologica della Rai è particolarmente 
impegnato su questo fronte in cui l'interazione fra 
uomo e strumenti tecnologici rende l'interattività 
più semplice e immediata anche in previsione 
dell'introduzione di futuri servizi evoluti. 


In due articoli di questo numero ci vengono illu¬ 
strate alcune delle applicazioni in via di sviluppo 
presso il Centro. In particolare, vengono descritte le 
funzionalità di alcuni prototipi finalizzati ad offrire 
un'esperienza di fruizione basata sull'uso di schermi 
secondari. La sperimentazione ha lo scopo di esplo¬ 
rare le opportunità e le sfide implicite nelle nuove 
modalità di interazione tra utente e media. Si sta 
infatti rendendo disponibile a buon mercato tutta 
una serie di dispositivi, o di puntamento wireless, o 
per comandi vocali, oppure basati sulla tecnologia 
di rilevamento del movimento; il riconoscimento 
dei gesti dell'utente permette a quest'ultimo di 
gestire l'intrattenimento TV a mani nude, rendendo 
obsoleto il tradizionale telecomando. 
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Tra le problematiche più stimolanti in materia di 
trattamento automatico delle immagini riveste 
oggi particolare interesse quella che si riferisce 
alla descrizione del contenuto multimediale me¬ 
diante l'uso di algoritmi matematici avanzati. Le 
applicazioni che se ne intravedono coprono una 
varietà di comparti, in relazione all'odierno contesto 
industriale in cui l'ottimizzazione delle risorse pro¬ 
duttive costituisce interesse primario; in particolare, 
si attendono interessanti risultati nel campo del 
riconoscimento automatico di immagini individuan¬ 
done, ad esempio, le informazioni all'interno di un 
vasto archivio. L'articolo"Le caratteristiche secondo 
MPEG-7 nello Spazio di Hilbert"descrive una tecnica 
per la rappresentazione di immagini digitali, come 
vettori di uno spazio degli stati di Hilbert e pro¬ 
pone un metodo per la rappresentazione digitale 
delle immagini attraverso l'uso dei descrittori visuali 
previsti dall'ormai consolidato Standard MPEG-7. 

In precedenti numeri della Rivista è stato ampiamen¬ 
te descritto il sistema di ripresa sonora denominato 
3D-VMS, basato sulla teoria Ambisonic; mediante 
l'uso di una sonda a più capsule, il sistema consente 
di attuare una ripresa multimicrofonica simulando 
la presenza di un massimo di 7 microfoni virtuali. 
La Rai ha utilizzato per la prima volta il sistema per 
la ripresa e trasmissione in diretta in occasione della 
diffusione dell'Opera Lucia di Lammermoor, su Rai 
Radio 3 e sulla rete Euroradio. Il sistema è tutt'ora 
in evoluzione e nell'articolo in oggetto vengono 
illustrate le caratteristiche di affidabilità e di qualità 
offerte, valutate realizzando sperimentazioni con 
varie tipologie produttive e di ripresa. 


Lo sviluppo di reti ferroviarie ad Alta Velocità, al 
di là delle inevitabili polemiche legate a fattori 
ambientali o di scelte economiche, costituisce 
ormai un processo inarrestabile nel processo di 
modernizzazione dei paesi europei. A bordo dei 
treni è già oggi disponibile una discreta gamma 
di servizi digitali (telefonia e broadband) destinati 
prevalentemente ad un'utenza di tipo business. Altri 
sono in via di sperimentazione. In questo contesto 
la Rai ha individuato una interessante opportunità 
per valorizzare il proprio know-how nel campo della 
TV Digitale estendendo il servizio radiotelevisivo 
anche ai viaggiatori in treno, che potrebbero cosi 
trascorrere il tempo di viaggio in maniera rilassata 
fruendo in tempo reale di news, eventi sportivi e 
programmi di intrattenimento. Il Centro Ricerche 
Rai e Rai Way S.p.A., la società del gruppo Rai che 
possiede e gestisce le infrastrutture di trasmissio¬ 
ne e diffusione del segnale radiotelevisivo, hanno 
elaborato un'ipotesi di soluzione che integra siner¬ 
gicamente collaudate tecnologie già impiegate nel 
settore del digitale terrestre televisivo. Nell'articolo 
"TAV-laTelevisione ad Alta Velocità"viene effettuata 
una disamina dei numerosi problemi da affrontare 
legati alla copertura del servizio (tratti a cielo aperto 
ed in galleria) o ai vincoli di dimensioni ed assorbi¬ 
mento degli apparati. 
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Premio ICMT 2011 

per la convergenza medìa-driven 

al progetto Rai+ 


14 GIUGNO 2011 

Giornata dell'Innovazione 

Il Premio sulla convergenza nell'ICMT (Information, 
Communication & Media Technology) è promosso 
da Confindustria Servizi Innovativi e Tecnologici 
nell'ambito del Premio Imprese per l'Innovazione di 
Confindustria. Assegna riconoscimenti a bestprac- 
tices d'innovazione digitale nelle telecomunicazioni, 
e-commerce, marketing, televisione. 

La premiazione è avvenuta al Quirinale alla presenza 
del Capo dello Stato nel corso della cerimonia per 
la consegna del Premio dei Premi che si tiene ogni 
anno in occasione della Giornata dell'Innovazione. 

Il Premio nell'ICMT, alla sua seconda edizione, punta 
a far emergere la nuova frontiera del Made in Italy 
tecnologico, basata sulla convergenza fra tecno¬ 
logie informatiche, telecomunicazioni, contenuti 
multimediali, su cui molte imprese italiane si stanno 
misurando per produrre servizi innovativi e nuovi 
modelli di business. 

Per il secondo anno consecutivo il Premio ICMT 2011 
per la categoria "convergenza Media-driven"è stato 
assegnato alla Rai per il progetto "Rai-i-" ed è stato 
ritirato dal Direttore Generale, Dott.ssa Lorenza Lei. 


Consegna per premio ICMT 2011 
per la convergenza Media-driven 
consegnato dal Presidente Giorgio Napolitano 
al Direttore Generale della Rai Lorenza Lei. 


Rai-i- è stato scelto per l'elevata convergenza tra con¬ 
tenuti e piattaforme, realizzata contestualizzando il 
flusso di immagini, video e testi televisivi attraverso 
l'uso delle tecnologie tipiche del mondo internet e 
delle telecomunicazioni. 

Con Rai-i- viene introdotto nella fruizione televisiva 
l'uso di nuovi terminali (tablet e smartphone) che 
rendono l'interattività molto più semplice e imme¬ 
diata anche nel ricorso ai futuri servizi evoluti. 

Il progetto, sviluppato dalla Direzione Strategie 
Tecnologiche con il Centro Ricerche Rai, si configura 
come un servizio attraverso cui l'utente può appro¬ 
fondire immediatamente i contenuti proposti da un 
programma televisivo, passando da una fruizione 
meramente "passiva" ad una più "attiva", basata 
sull'interazione con altri dispositivi tecnologici. 
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Nuovi paradigmi per 
l'interazione uomo-media: 

la "TV aumentata" e "Senza telecomando" 




Roberto lacoviello e Paola Sunna, 
Rai - Centro Ricerche e InnovazioneTecnologica 


Sommario 

Questo articolo descrive 
alcuni prototipi sviluppati 
al Centro Ricerche della 
Rai per offrire un'espe¬ 
rienza di fruizione 
basata sull'uso di 
multischermo 
interattivo e per 
esplorare le opportu¬ 
nità e le sfide implicite 
nelle nuove modalità 
di interazione uomo¬ 
media. I concetti e gli 
argomenti sono stati af¬ 
frontati dal punto di vista 
degli enti radiotelevisivi. 


1. Introduzione 

L'interazione uomo-media è un argomento caldo tra ri¬ 
cercatori e progettisti. 

La diffusione delle nuove tecnologie"abilitanti"(a esempio 
la disponibilità a buon mercato di dispositivi di puntamen¬ 
to wireless, per comandi vocali, telecamere 3D, basati sulla 
tecnologia di rilevamento del movimento,...) può aiutare a 
plasmare un'esperienza "arricchita", molto più interattiva e 
coinvolgente, pur mantenendo semplicità e accessibilità. 

In particolare, il controllo gestuale potrebbe rimodellare 
l'esperienza della visione nel soggiorno al di là del gioco 
elettronico (un esempio è il sistema Kinect [1] trattato 
nell'articolo che segue) permettendo agli utenti di gestire 
l'intrattenimento TV a mani nude, rendendo il tradizionale 
telecomando un dispositivo elettronico del passato. 
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L'attenzione è posta sulla descrizione dei prototipi 
realizzati al Centro Ricerche della Rai allo scopo di: 

'C permettere la confluenza dei servizi primari 
di diffusione con quelli aggiuntivi identificati 
come "contenuti e interattività", per offrire una 
presentazione più attraente e "aumentata" su 
terminali mobili via IP (Internet Protocol); 

'C abilitare il controllo gestuale nel dominio TV. 

Una particolare attenzione è rivolta ai requisiti, dal 
punto di vista degli enti radiotelevisivi, necessari 
per fornire agli utenti questi nuovi tipi di esperienza 
arricchita e coinvolgente. 

La Rai ha ricevuto il Premio ICMT 2011 per la cate¬ 
goria "convergenza Media-driven" per il progetto 
"Rai-i-" che comprende i concepì "Chi sei" e "Gioca 
con me", oggetto di questo articolo. 

2. Gli strumenti tecnologici 

Incominciano ad apparire nelle case set-top-box 
ibridi e televisori in grado di ricevere sia i programmi 
televisivi convenzionali sia i contenuti a banda larga 
e nuovi comportamenti di fruizione sono influenzati 
dalla disponibilità di tariffe fìat per la connessione, 
che consentono una nuova realtà multi-schermo, 
fatta di televisione, ma anche PC e terminali mobili. 

E' iniziata l'era dello stile di vita always-on, grazie 
ad una connessione onnipresente e ininterrotta a 
Internet (anche tra gli stessi dispositivi): le genera¬ 
zioni nate dopo il 1990 non possono rinunciare alle 
attività di social network e all'uso dei dispositivi mo¬ 
bili che accompagnano le loro attività quotidiane. 

E'Ia tecnologia a rendere possibile questa esperien¬ 
za visiva senza interruzioni, ed una forte creatività è 
il mezzo che vincola gli spettatori in questa naviga¬ 
zione continua tra questi mondi (media radiodiffusi, 
media on-line, altri spettatori "sociali", ...) diversi, 
ma non ancora "in sincrono": attraverso un viaggio 
trans-mediale. 

Di conseguenza le società radiotelevisive cercano di 
sfruttare sempre più queste stimolanti opportunità 



Acronimi e sigle 

API 

Application Programming Interface 

loT 

of Th i ng 

MIT 

Massachusetts Institute ofTechnology 

MPEG 

Movig Picture Experts Group 
(ISO/IEC JTC 1/SC 29/WG 11) 

OCR 

Optical character recognition 

RSS 

RDF Site Summary 

Really Simple Syndication 

SIFT 

Scale-Invariant FeatureTransform 

ToF 

Time of Flight 


per promuovere il loro marchio attraverso un'offerta 
arricchita ed interattiva, utilizzando la distribuzione 
mediante più canali e dispositivi sofisticati. Si sta 
rivelando sempre più importante, per rendere più 
profonda la relazione tra i proprietari dei contenuti 
ed il loro pubblico, la possibilità di fornire all'utente, 
mentre guarda il programma in tempo reale o in dif¬ 
ferita, funzionalità quali indice di gradimento, quiz, 
risultati di sondaggi, voti, "condivisione" sociale, 
informazioni supplementari su dispositivi mobili 
(tablet e smart phone). 

Ma la sola interpretazione creativa di questi com¬ 
portamenti individuali e sociali non sarebbe suffi¬ 
ciente se non si ottenesse come risultato anche un 
adeguato controllo dell'enferfo/nmenf! 

Nell'era "Internet delle cose"'^°‘^ ', un dispositivo 
digitale (set-top-box, console per videogiochi, tele¬ 
visore ...) è in grado di vedere, di capire e interagire 
con il mondo circostante aprendo così la strada a 
nuovi paradigmi di comunicazione uomo-macchina. 
Queste caratteristiche sono tipiche delle nuove 
telecamere ("vedere"attraverso i sensori) e schermi 
secondari ("vedere" attraverso la connettività IP) 
utilizzati per costruire i nostri concepì. 

Nota 1 - Internet delle cose (o Internet degli oggetti), è 
un neologismo che trae origine dall'inglese Internet of 
Things riferito all'estensione di Internet al mondo degli 
oggetti e dei luoghi concreti. Il concetto dell'internet 
delle cose è attribuito all'Auto-ID Center, fondato nel 
1999 e da allora con sede al MIT. 
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E'possibile, ad esempio, catturare i movimenti de¬ 
gli utenti in tempo reale con un'unica telecamera 
3D in grado di rilevare la profondità. Incorporare 
tali dispositivi nei prodotti elettronici di consumo 
e adottare accurati algoritmi di riconoscimento 
delle forme permette ai creativi di immaginare una 
incredibile serie di nuove possibilità e di sviluppare 
nuove applicazioni interattive, di tipo immersivo e 
intuitivo, basate sui gesti dell'utente. 

Gli "schermi secondari" sono i terminali portatili 
avanzati e collegati a internet (smartphone, tablet, 
...) che stanno diventando i compagni di ogni giorno 
degli utenti, anche quando guardano i tradizionali 
programmi televisivi. 

Dal punto di vista del broadcaster, gli schermi se¬ 
condari favoriranno la creazione di mini-format as¬ 
sociati al brand, non a detrimento dteW'audience per 
il programma televisivo primario, ma, al contrario, 
in grado di creare opportunità di profitto, consen¬ 
tendo di focalizzare l'attenzione del pubblico sul 
brand, di analizzare ciò che vede l'utente, di offrire 
contenuti premium,... 

3. Dal concetto allo sviluppo 

Si esaminano le interfacce multimodali per il con¬ 
trollo dell'esperienza entertainment sullo schermo 
del televisore e la presentazione in forma interattiva 
delle informazioni su schermi secondari (realizzata 
per le piattaforme Android e iOS). 


3.1 Senza TELECOMANDO 

I terminali mobili (tablet, smartphone, notebook ...) 
si sono evoluti dando origine a dispositivi potenti, 
utilizzati anche per controllare in remoto lo schermo 
del televisore principale, ma le loro capacità di in¬ 
terfacciamento risultano in realtà, per questo scopo, 
piuttosto limitate. Sono possibili scenari totalmente 
nuovi, grazie alle interfacce gestuali. 

Si è studiato e realizzato un sistema di riconoscimen¬ 
to gesti per fornire in modo naturale l'interazione 
con una interfaccia utente di tipo grafico. I gesti 
della mano, eseguiti nello spazio libero, sono ricono¬ 
sciuti da algoritmi specifici, e danno origine a nuove 
metafore per l'interazione tra utenti e dispositivi di 
homeentertainment, possibilmente senza richiedere 
la calibrazione del sistema ed un periodo di training 
per l'utente. 

I componenti del sistema sviluppato per il rico¬ 
noscimento dei gesti basato sulla visione sono 
rappresentati in figura 1. 

L'acquisizione avviene tramite una telecamera ToF 
che fornisce la profondità d'immagine della scena (la 
profondità è la distanza tra la telecamera e il punto 
dell'oggetto corrispondente a quello dei pixel). Tale 
immagine è ì'input di una fase di rilevamento che, 
dopo il filtraggio del rumore e alcune elaborazioni 
per eliminare eventuali imperfezioni presenti, for¬ 
nisce le coordinate 2D della posizione e la distanza 
della mano dalla telecamera (coordinata Z). L'ultima 
fase prevede l'inseguimento (tracking) della mano 


Estrazione 

Riconoscimento 

Inseguimento 

dell'immagine 

della mano 

della mano 


Fig.l - Componenti del software sviluppato per il riconoscimento sulla base della visione dei gesti. 
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Fig. 2 - Interfaccia grafica d'utente basata sulla 
guida gestuale. 


ottenuto con una fase di rilevamento continuo. E 
così possibile individuare due tipi di eventi: il punta¬ 
mento ottenuto mediante le coordinate 2D e l'ope¬ 
razione di click in base alla distanza (coordinata Z). 

L'interfaccia grafica sviluppata presso il Centro Ri¬ 
cerche comprende un menu di quattro elementi: 
Catch-upTV, Photo, News, TV (figura 2) seleziona¬ 
bili dall'utente con un click, muovendo una mano 
nell'ambito dello schermo. All'interno di ogni se¬ 
zione l'utente può poi navigare puntando la mano 
e fare click per leggere un feedRSS, avviare un video, 
una sequenza di foto, richiedere l'avanzamento 
veloce o il riavvolgimento di un video. 


3.2 Chi sei? 

Le nostre applicazioni mobili a realtà aumentata 
mostrano informazioni aggiuntive, contestuali ai 
contenuti video sul televisore, su schermi secondari, 
che diventano una estensione"fisica"dello schermo 
principale. 

Nell'uso ipotizzato, l'applicazione a realtà aumen¬ 
tata cerca di soddisfare la curiosità dell'utente di 
conoscere l'identità delle persone presenti sullo 
schermo mentre guarda il programma televisivo. 

L'applicazione identifica automaticamente il perso¬ 
naggio ripreso con la fotocamera in dotazione al te¬ 
lefono la cui immagine è inviata a un server remoto. 
Il nucleo dell'algoritmo per questa applicazione è 
la SIFT [2] ampiamente utilizzata in computer vision 
per descrivere un'immagine come un insieme di 
caratteristiche rilevabili anche in caso di variazioni 
di scala dell'immagine, di rumore e di illuminazione. 

Il sistema confronta specifici lineamenti del viso 
estratti dall'immagine con quelli memorizzati in 
un "database di caratteristiche facciali"e restituisce 
il nome del personaggio e una breve biografia 
(figure 3 e 4). 

In questa fase, è unitilizzata una API in dotazione al 
dispositivo per realizzare la conversione da testo a 
parlato applicato alle didascalie sullo schermo. 
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3,3 Gioca con me 

Questo è il prototipo di un'applicazione che per¬ 
mette agli utenti di interagire nell'ambito di un 
programma a quiz durante la trasmissione televisiva, 
partecipando al gioco insieme ai concorrenti reali. 

In questo scenario, l'utente scatta una foto (con il 
suo terminale mobile) della domanda in sovrappo¬ 
sizione sullo schermo del televisore, l'applicazione 
la invia al server remoto della Rai per l'elaborazione 
e riceve le possibili risposte che vengono poi pre¬ 
sentate sul terminale mobile, in modalità realtà 
aumentata (figure 5-6). 

Il riconoscimento ottico dei caratteri (OCR) è utiliz¬ 
zato per interpretare il testo della domanda a partire 
da una versione opportunamente ridimensionata 
della foto originale. Tale ridimensionamento è 
necessario per ridurre le dimensioni del file, e di 
conseguenza il tempo di elaborazione OCR. 

Il testo estratto è confrontato con il database Rai che 
contiene il testo delle domande possibili, al fine di 
identificare le relative risposte. 

4. Scenari futuri 

Segue una sintesi delle principali problematiche 
emerse nel corso dello sviluppo dei prototipi pre¬ 
cedentemente descritti e le implicazioni ad esse 
associate 


4,1 Interfacce gestuali 

Attualmente, Kinect è il solo dispositivo elettronico 
consumer disponibile sul mercato che permette di 
giocare con Xbox 360 utilizzando gesti e comandi 
vocali, senza la necessità di un controller. 

Questo è solo l'inizio e, probabilmente lungo è il 
cammino prima di vedere questo tipo di interazio¬ 
ni adottate negli ambienti PC, SmartTV e Set Top 
Box. Tuttavia stanno emergendo in gran numero 
software proprietari e open source di tipo midd- 
leware in grado di rilevare caratteristiche facciali, 
gestualità, identificare l'utente, rilevare movimenti 
di parti del corpo dell'utente, interpretare la scena 
per consentire il controllo individuando la presenza 
di più utenti. 

Gli elementi chiave per il successo di questi nuo¬ 
vi paradigmi di interazione sono: rilevamento e 
inseguimento privo di errori e senza interruzioni 
dei gesti, anche in presenza di occlusioni, rapidità 
di risposta. Possono apparire come dettagli agli 
enti radiotelevisivi interessati a fornire questo tipo 
di esperienza immersiva, ma in realtà è necessario 
sviluppare un set completo di strumenti e API agno¬ 
stico nei confronti di hardware e software di base 
al fine di ridurre drasticamente i cicli di sviluppo. In 
particolare, queste API (ancora mancanti) permette¬ 
rebbero agli sviluppatori di applicazioni di utilizzare 
una varietà di sensori e disposivi di controllo per 
rendere possibile all'utente l'impiego dei coman- 
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di gestuali per la navigazione (ad esempio nella 
scena televisiva, per i menu di giochi, nell'ambito 
delle interfacce Web); comandi come puntamento, 
selezione mediante click, spostamento di oggetti, 
onde, cerchi, ecc... 

4.2 Riconoscimento facciale 

La ricerca visuale implica prendere una foto di 
qualcosa o qualcuno, in base alla quale effettuare 
una querydì ricerca, attendere tempi pari a secondi 
dovuti ai tempi di elaborazione, e ulteriori ritardi per 
il trasferimento di immagini di grandi dimensioni. 
Quindi una buona precisione, minimizzando la pro¬ 
babilità di falsi risultati ed una breve latenza sono 
le chiavi per ottenere l'adozione e la diffusione di 
questa tecnologia. 

Molto impegnativo è l'investimento sulle strutture 
a supporto dei servizi: sono necessari miliardi di 
immagini e di metadati ad esse relative; queste in¬ 
formazioni devono essere acquisite, memorizzate 
e indicizzate, e diventa fondamentale la ricerca e il 
recupero di queste informazioni in modo efficiente 
dai database. 

E'possibile raggiungere un più alto livello di presta¬ 
zioni, ridurre il carico sulle reti wireless e migliorare 
l'interoperabilità mediante la definizione, su basi 
standard, di descrittori visuali compatti (utilizzando 
eventualmente supporti hardware per l'estrazione 
dei descrittori) e del corrispondente processo di 
estrazione, così come previsto da MPEG. 

4.3 Sincronizzazione tra TV e 

SCHERMI SECONDARI 

Il concepì realizzato si basa sul servizio principale 
di tipo televisivo, i cui contenuti sono preregistrati, 
in modo che la diffusione del contenuto IP non 
pregiudichi la correttezza della competizione. L'ap¬ 
proccio seguito è basato su OCR, potrebbe essere 
potenziato in futuro grazie ad un ridotto periodo di 


latenza e ad una maggiore precisione del motore 
dell'OCR, non richiede una stretta sincronizzazione 
temporale tra i contenuti principali e quelli seconda¬ 
ri ed il formato quiz consente la gestione del ritardo 
variabile end-fo-enc/tipico del percorso IP, grazie al 
fatto che l'utente necessita di un tempo significativo 
per selezionare la risposta giusta. 

L'identificazione automatica del canale TV e dei 
relativi contenuti è fondamentale per permettere 
la perfetta sincronizzazione temporale tra i conte¬ 
nuti televisivi ed i servizi interattivi supplementari 
destinati ai terminali mobili, è ciò è ancora più vero 
nel caso di programmazione di tipo Live TV. 

In alternativa all'uso dell'OCR, si può basare la sin¬ 
cronizzazione con il televisore principale sull'atti¬ 
vazione automatica di richieste di informazioni, ma 
ciò richiederebbe che la generazione dei metadati 
sia precisa e dettagliata a lato back-end. Occorre 
ulteriormente approfondire come effettuare la 
risincronizzazione tra le richieste generate e i dati 
fatti pervenire via IP al fine di convalidare le risposte 
fornite dagli utenti da casa. 

5. Conclusioni 

Sono in gran numero le possibilità e gli scenari che 
si possono aprire per gli enti televisivi grazie alla 
diffusione di prodotti multischermo e alle nuove 
forme di interazione uomo-media. 

I concepì illustrati permettono, in questo contesto, 
di aggiungere immersività e pervasività all'esperien¬ 
za di intrattenimento domestico. 

I sistemi qui descritti hanno scopo dimostrativo e 
richiedono ulteriori miglioramenti prima che sia 
possibile effettuare prove sul campo, ma rendono 
evidente come sia la tecnologia sia la creatività siano 
fondamentali per rendere possibile scenari più ricchi 
per l'intrattenimento televisivo. 
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Al fine di evitare una Babele causata della prolife¬ 
razione di realizzazioni non compatibili fra loro, è 
necessario un processo di armonizzazione per molti 
degli aspetti presenti in questo scenario, quali il for¬ 
mato dei metadati, i set di comandi e di messaggi. 

Inoltre, la cooperazione di applicazioni realizzate per 
più dispositivi non interoperabili potrebbe richie¬ 
dere una quantità enorme di lavoro di sviluppo nel 
caso di proliferazione delle applicazioni, rendendo 
quindi cruciale la disponibilità di strumenti per la 
conversione automatica tra piattaforme diverse. 
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Senza telecomando 

Un tour virtuale per i 150 anni deM'Unità d'Italia 


Christian Culeddu, 
Eurix, Torino 

Roberto lacoviello, 

Rai - Centro Ricerche e innovazioneTecnologica 


1. Introduzione 

A complemento di quello che lo precede, questo articolo è focaliz¬ 
zato sulla descrizione del concepf di controllo gestuale realizzato 
presso il Centro Ricerche Rai utilizzando Microsoft Kinect'^°‘=\ 

2. Sviluppo del concetto 

L'idea è stata sviluppata nel contesto del 150° anniversario 
dell'unità di Italia e consente all'utente di affrontare un tour vir¬ 
tuale, arrichito da informazioni testuali e multimediali aggiuntive, 
attravenso i luoghi in cui si svolsero le battaglie che portarono 
all'unificazione. L'interfaccia grafica è riportata in figura 1. 


Sommario 

Un esempio di applicazione per 
illustrare i concetti di intera¬ 
zione uomo-media mediante 
telecomando gestuale studiati e 
realizzati sotto forma di dimo¬ 
stratori presso il Centro Ricerche 
della Rai. 



L'Itaiia, uffieMmtntt RtpubbUea 
itatiano, è uno Stato membro 
deU'Unione Suropeo situato 
neU'Buropa meridionale affaeeiata 
sul mar Mediterraneo, il sui 
territorio coincide in gran parte con 
l'omonima regione geografica. Il 
paese si estende su una superficie di 
301.336 km‘ e conta 60.626.442 
abitanti 



Additional 

Information 



SEi^H 

B^ES 

L;^S 

SI^E 


Main Menu 


Nota 1 - Kinect (inizialmen¬ 
te conosciuto con il nome 
Project Natal), è un dispositi¬ 
vo di input della Microsoft per 
la console giochi Xbox 360 
che consente agli utenti di 
controllare ed interagire con 
la console senza sia neces¬ 
sario toccare uno specifico 
strumento, bensì utilizzando 
i gesti e mediante comandi 
vocali. 


Fig. 1 - Interfaccia grafica 
d'utente. 
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Il menu principale comprende quattro elementi: 

Cerca: mediante una tastiera QWERTY l'utente 
può indicare un qualsiasi luogo esplorabile con 
Google Earth. 

Battaglie: lista delle battaglie combattute nel 
corso del Risorgimento. Dopo aver scelto la bat¬ 
taglia, la mappa è automaticamente posizionata 
sul luogo e l'utente può con gesti delle mani e 
accedere a video e informazioni testuali relative 
alla battaglia. 

Livelli: per accedere (vedere o nascondere) ai 
livelli aggiuntivi su Google Earth, come quelli 
collegati a Wikipedia o Photo. 

Condividi: condividere locazioni preferite con 
gli amici via mail, twitter o facebook. 

Per interagire con l'applicazione l'utente deve 
muovere la mano fino a quando Kinect la riconosce 
e avvia il processo di inseguimento (tracking) dei 
movimenti. Un pupazzo bianco informa l'utente 
agitando la mano qualora l'inseguimento sia perso 
e sia quindi necessario efettuare nuovamente l'ope¬ 
razione di riconoscimento. 

I movimenti della mano corrispondono ai comandi: 
la direzione del movimento della mano corrisponde 
allo spostamento del cursore sullo schermo e la 
selezione (click) è realizzata quando la mano indica 
un pulsante per almeno tre secondi, evidenziati 
mediante la visualizzazione di un conteggio alla 
rovescia. 

L'azione di trascinamento effettuata con la mano 
corrisponde al movimento dell'utente nell'ambito 
della mappa di Google Earth. 

3. Dettagli tecnici 

Al momento in cui è stato realizzato il dimostratore, 
non era ancora stato rilasciato il software di sviluppo 
ufficiale di Microsoft Kinect (SDK, SoftworeDeve/op- 
mentKit) mentre erano disponibili diverse versioni 
"non ufficiali"e"open-source"(OpenNI,OpenKinect, 
OpenFramework, Code Laboratories,...). 


Microsoft Visual Studio 2010 e Microsoft Expression 
Blend 4 sono stati utilizzati per il progetto dell'inter¬ 
faccia grafica utente. 

4. Questioni aperte e ulteriori sviluppi 

Durante la fase di test, si è riscontrato che l'insegui¬ 
mento della mano è molto veloce e poco sensibile 
agli errori per cui si perde raramente e la posizione 
del cursore guidato dalla mano rimane sufficiente- 
mente stabile sul bersaglio. Risulta invece scarsa la 
precisione al momento in cui la mano viene mossa, 
a partire dal centro dell'immagine verso la periferia: 
la posizione del cursore, inizialmente coincidente 
con quella della mano, subisce una deriva. 

Ulteriori sviluppi sono previsti nel momento in cui 
sarà disponibile la SDK ufficiale di Microsoft [2], che 
comprende le API per il riconoscimento dei comandi 
vocali.Tali sviluppi saranno focalizzati all'ambiente 
di produzione televisiva e agli effetti speciali e 
all'uso dei point cioud, previsti dalle API Kinect e 
atti a rappresentare le coordinate tridimensionali 
dei vertici di un oggetto, per la segmentazione 
automatica delle scene video. 
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Breve Glossario su spazio di Hilbert e MPEG-? 

a cura di Marzio Barbero 

Per facilitare la lettura dell'articolo che segue, poiché affronta 
temi inusuali per questa rivista, si propone una breve descrizione, 
in parte tratta da Wikipedia, di alcuni dei termini in esso utilizzati. 


Meccanica quantistica: si distingue 
dalla meccanica classica in quanto 
esprime la probabilità di ottenere un 
dato risultato a partire da una certa 
misurazione. Questa condizione di 
incertezza o indeterminazione non 
è dovuta a una conoscenza incom¬ 
pleta, da parte dello sperimentatore, 
dello stato in cui si trova il sistema 
fisico osservato, ma è da considerarsi 
una caratteristica intrinseca, quindi 
ultima e ineliminabile, del sistema e 
del mondo subatomico in generale. 
Descrive i sistemi come una sovrap¬ 
posizione di stati diversi e prevede 
che il risultato di una misurazione 
non sia completamente arbitrario, 
ma sia incluso in un insieme di pos¬ 
sibili valori: ciascuno di detti valori 
è abbinato a uno di tali stati ed è 
associato a una certa probabilità 
di presentarsi come risultato della 
misurazione. 

Spazio di Hilbert: è un insieme con 
una struttura lineare (spazio vetto¬ 
riale), su cui è definito un prodotto 
scalare (in particolare, quindi, è 
possibile parlare di distanze, angoli, 
ortogonalità), e tale che sia garantita 
la completezza (ossia, che non vi 
siano dei comportamenti patologici 
nel processo di passaggio al limite). 
In meccanica quantistica uno stato 
fisico può essere rappresentato da 
un elemento (vettore o ket) o da una 
opportuna combinazione lineare di 
elementi dello spazio di Hilbert. Lo 
stato fisico contiene informazioni 
le quali possono essere esplicitate 
proiettando il ket di stato su un au¬ 
tostato di una osservabile. 

Operatore hermitiano: in algebra li¬ 
neare, è detto anche operatore auto¬ 
aggiunto 0 operatore simmetrico nel 
caso reale; è un operatore lineare su 
uno spazio di Hilbert H che è uguale 
al suo aggiunto. L'aggiunto di un 
operatore generalizza il trasposto 


coniugato di una matrice quadrata 
al caso infinito dimensionale e il 
concetto di complesso coniugato di 
un numero complesso. 

Autovettore: In algebra lineare, un 
autovettore di una trasformazione 
lineare è un vettore non nullo che 
non cambia direzione nella trasfor¬ 
mazione. Il vettore può cambiare 
quindi solo per moltiplicazione di 
uno scalare, chiamato autovalore. In 
meccanica quantistica, gli operatori 
corrispondono a variabili osservabili, 
gli autovettori sono chiamati anche 
autostati e gli autovalori di un opera¬ 
tore rappresentano quei valori della 
variabile corrispondente che hanno 
probabilità non nulla di essere misu¬ 
rati. Il termine autovettore è stato 
tradotto dalla parola tedesca Eigen- 
vektor, coniata da Hilbert nel 1904. 
Eigen significa proprio, caratteristico. 

MPEG (Moving Picture Experts 
Group): è un comitato tecnico 
congiunto delle organizzazioni in¬ 
ternazionali ISO e lEC costituito nel 
gennaio 1988 per definire standard 
per la rappresentazione in forma 
digitale di audio, video e altre ti¬ 
pologie di contenuti multimediali 
in modo da soddisfare un'ampia 
varietà di applicazioni. MPEG-1 
(1993) sviluppato per la codifica 
audio video, utilizzando come sup¬ 
porto per la memorizzazione il CD. 
MPEG-2 (1995), largamente diffuso, 
perchè adottato per la codifica audio 
e video per la televisione digitale (es. 
gli standard DVB) e per il DVD-Video. 
MPEG-4 (1998), nato per consentire 
un'ampia gamma di applicazioni 
multimediali, include AVC (Advance 
Video Codingj, caratterizzato da 
una elevata efficienza di codifica 
del segnale video e adottato per 
i sistemi di seconda generazione 
della televisione digitale e di dischi 
ottici. MPEG-7 (2002) non è uno 


standard per la codifica video e audio; 
utilizza il linguaggio XLM per memo¬ 
rizzare metadati, descrittori associati 
con i contenuti che consentono 
una ricerca veloce ed efficiente dei 
contenuti di interesse per l'utente. 
MPEG-21(2001) nato per sviluppare 
una piattaforma comune per le ap¬ 
plicazioni multimediali. E' basato su 
due concetti essenziali: la definizione 
di un elemento digitale come unità 
fondamentale per la distribuzione e 
le modalità di interazione tra l'utiliz- 
zatore e gli elementi digitali. 

MPEG-7: è nato per per definire l'or¬ 
ganizzazione dei dati multimediali. 
Sono normalizzati un insieme di Sche¬ 
mi di Descrizione (DS) e di Descrittori 
(D); un linguaggio atto a specificare 
tali schemi, denominato Linguaggio 
di Defininizione della Descrizione 
(DDL); uno schema per codificare la 
descrizione. 

MPEG 7Visual: Definisce i descrittori 
e contenuti da associare alla parte vi¬ 
suale di un documento multimediale. 
Vi sono gruppi di descrittori: il gruppo 
del colore prevede 7 descrittori; quel¬ 
lo della tessitura (texture) e della for¬ 
ma (shape) ne includono 3 ciascuno; 
4 per la descrizione del movimento e 
2 per la localizzazione. 

SIFT (Scale-Invariant FeatureTrans- 
form): è un algoritmo utilizzato per la 
visione computerizzata che permette 
di rilevare e descrivere caratteristiche 
locali in immagini. Per ogni oggetto in 
un'immagine di apprendimento, sono 
estratti punti interessanti per fornire 
una descrizione delle caratteristiche 
dell'oggetto. Per un riconoscimento 
affidabile, è importante che le carat¬ 
teristiche estratte dall'immagine di 
apprendimento siano rilevabili anche 
con cambiamenti di scala, rumore e 
illuminazione. Il metodo, pubblicato 
da David Lowe nel 1999, può identi¬ 
ficare in modo robusto oggetti anche 
nella confusione o parzialmente 
nascosti, perché il descrittore SIFT 
è invariante per scala, orientazione 
e distorsione affine e parzialmente 
invariante a cambi di illuminazione. 


Le caratteristiche secondo MPEG-7 
nello Spazio di Hilbert 

Interrogazioni per individuare immagini simili 
utilizzando la sovrapposizione lineare 


Elisa Maria Todarello e Walter Allasia 
Eurix, Torino 

Mario Stroppiarla, 

Rai - Centro Ricerche e InnovazioneTecnologica 


1. Introduzione 


E' descritta una tecnica per la rappresentazione di 
immagini digitali, raggruppamenti {cluster) e inter¬ 
rogazioni iquery) come vettori di uno spazio degli 
stati di Hilbert seguendo le regole della meccanica 
quantistica (QM). Si parte dalla considerazione che 
esistono analogie tra il processo atto ad individuare 
informazioni aN'interno di un archivio, utilizzando 
criteri di somiglianza, ed il processo di misurare una 
grandezza fisica. Nell'approccio formale qui seguito, 
i raggruppamenti sono rappresentati come sovrap¬ 
posizioni lineari dei vettori che rappresentano i sin¬ 
goli membri del raggruppamento. E'stato realizzato 
un prototipo software che applica l'idea a gruppi 
di immagini digitali utilizzando i Descrittori Visuali 
previsti nello standard MPEG-7. Per valutare le pre¬ 
stazioni del software sviluppato è stato effettuato 


* Questo articolo è basato sul contributo "IVlPEG-7 
Features in Hilbert Spaces: Querying Similar Images 
with Linear Superpositions", presentato al 5° Interna¬ 
tional Quantum Interaction Symposium tenuto ad 
Aberdeen, UK dal 26 al 29 giugno 2011. 


Sommario 

Ci sono alcune analogie tra Information Retrivai 
(recupero delle informazioni) e il processo di 
misurazione di una quantità osservabile nel 
campo della meccanica quantistica (QM). Que¬ 
sto lavoro, a partire da tali analogie, propone 
un metodo perla rappresentazione digitale 
delle immagini attraverso l'uso dei descrittori 
visuali previsti da MPEG-7. Clusters sono de¬ 
scritti come sovrapposizioni di vettori, tenen¬ 
do conto della distribuzione dei valori delle 
caratteristiche visive di tutti i loro membri. 
Sono calcolati dei punteggi che indicano la 
somiglianza fra immagini, facendo uso della 
struttura geometrica degli spazi di Hilbert e 
delle regole della meccanica quantistica, e tali 
punteggi sono utilizzati per l'assegnazione del¬ 
le immagini ai diversi raggruppamenti. E'stato 
sviluppato un prototipo software per valutare i 
vantaggi offerti da tale metodo per il recupero 
delle informazioni basato sul loro contenuto 
(CBIR). 
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un test preliminare per determinare le assegnazioni 
ai raggruppamenti di immagini appartenenti ad un 
insieme campione. 

La sezione 2 riporta una rapida panoramica delle 
opere e teorie analizzate per lo sviluppo di questo 
lavoro. Il metodo proposto è descritto nella sezione 
3. La realizzazione del software e del test sono de¬ 
scritte nella sezione 4. Conclusioni e suggerimenti 
il lavoro futuro sono indicati nella sezione 5. 

2. Lavori correlati 

L'idea di una analogia concettuale tra gli elementi 
di QM e IR è stata formulata perla prima volta in [1]: 
la rilevanza di un documento nei confronti di una 
interrogazione è associata ad un operatore hermi- 
tiano R su uno spazio di Hilbert in cui gli oggetti 
sono rappresentati come vettori normalizzati. Per 
mezzo del teorema di Gleason, una misura di pro¬ 
babilità è definita in ogni sottospazio. In [1] non si 
fa riferimento ad un tipo specifico di documento 
(testo, immagine o altro). 

Attualmente vi sono diversi gruppi di ricerca che 
lavorano in questo campo. Una panoramica dello 
stato dell'arte è disponibile in [2]. In particolare, due 
opere orientate al recupero di documenti di testo 
sono [3], incentrata sulla descrizione del contesto in 
una attività di recupero di informazioni (IR task), e 
[4], dedicato alla modellazione dell'interazione con 
l'utente. In [5] è proposta una tecnica per unificare 
il recupero di immagini digitali in base alle annota¬ 
zioni e quello in base ai contenuti, incentrato sulle 
caratteristiche HSV. 

Proponiamo una tecnica per il recupero in base al 
contenuto (CBIR) di immagini digitali, utilizzando i 
Descrittori Visuali di MPEG-7 [6]. 

Si riassume brevemente il formalismo matematico 
adottato in QM, descritto più accuratamente in [7]. 

Lo stato di un sistema fisico è rappresentato da un 
vettore di stato normalizzato, | ip > G % dove y- è 
lo spazio degli stati di Hilbert. Una grandezza os¬ 
servabile, % è rappresentata in y da un operatore 
hermitiano, X. Gli autovalori di X sono i possibili 


Acronimi e sigle 


CBIR 

Content-Based Information Retrieval 

CVDS 

Compact Descriptors for Visual Search 

HSV 

Hue, Saturation, Value 

IR 

Information Retrieval 

MPEG 

Movig Picture Experts Group 
(ISO/IEC JTC 1/SC 29/WG 11) 

QM 

Quantum Mechanics 

SIFT 

Scale-Invariant FeatureTransform 


risultati di una misura di 2" Ogni autovalore è asso¬ 
ciato ad un sottospazio di y mediante l'equazione 
agli autovalori. Gli autovettori (normalizzati) di X 
costituiscono una base ortonormale per y. Questo 
dimostra che y ha una dimensione per ogni pos¬ 
sibile valore di Z 

La probabilità (jp.) di ottenere l'autovalore «.come 
risultato di una misura di X in un sistema nello stato 
I i|j ) è dato dalla proiezione ortogonale di | ) sul 

corrispondente sottospazio degli autovalori: 

7^^(« = i) = |a)J2 = <i|j |Pji|j> (1) 

dove P. è il proiettore sul sottospazio associato 

all'autovalore e co.è l'ampiezza probabilità di ot¬ 
tenere «. quando viene effettuata una misura di X. 

3. Rappresentazione di immagini e 

CALCOLO DELLA RILEVANZA 

Illustriamo un metodo per la rappresentazione di 
documenti, raggruppamenti e interrogazioni in un 
unico spazio. Il metodo permette il calcolo di un 
punteggio (score) associato alla somiglianza tra i 
documenti. Questo punteggio è utilizzato per l'as¬ 
segnazione al raggruppamento. La motivazione alla 
base del metodo presentato è esplorare l'analogia 
concettuale e formale tra IR e QM, allo scopo di de¬ 
terminare le potenzialità ed i limiti di questa applica¬ 
zione alle immagini digitali. Questo approccio teori¬ 
co è particolarmente adatto per la rappresentazione 
dei raggruppamenti come sovrapposizioni lineari di 
vettori, così come spiegato nel seguito. Utilizzando 
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la rappresentazione proposta, l'assegnazione di 
un'immagine a un raggruppamento è associata in 
modo naturale al processo di misura di una quantità 
osservabile in meccanica quantistica. Illustriamo la 
mappatura degli elementi QM ai concetti IR attra¬ 
verso un semplice esempio. Il metodo può essere 
applicato a qualsiasi caratteristica. Si consideri un 
immagine descritta da una caratteristica visuale, % 
che può assumere i valori quantizzati 0,1,2. 

(. Zviene rappresentato come operatore hermi- 
tiano, X sullo spazio di Hilbert ’H. 

2. Gli autovalori di X coincidono con l'insieme 

dei valori che la quantità caratteristica può 
assumere, cioè < 1 =^ = 0 = 1, = 2. In questo 

esempio, assumiamo che gli autovalori non 
siano degeneri. 

3. Lo spazio degli stati è l'insieme delle com¬ 
binazioni lineari {sparì) degli autovettori di X.. 
Indicando l'autovettore associato ad come 
I ), una base ortonormale per y- è 

4. Un documento d è associato ad un vettore 
I d ) G y quindi può essere espresso come 
una combinazione lineare dei vettori 
che costituiscono la base. Nell'esempio, 
I d ) = I co. I !t;.) dove gli co. sono pesi deno¬ 
minati ampiezze di probabilità. 

Si noti che si assume che tutti i vettori considerati 
siano normalizzati a 1. Si può verificare che y ha 
una dimensione per ogni possibile valore di X. 
Ad esempio un documento che ha valore 0 per X 
sarà rappresentato come | d ) = | 0 ). Questa rap¬ 
presentazione è banale per singoli documenti: il 
vettore documento sempre coincide con uno degli 
autovettori di X, vale a dire che ha un valore ben 
definito per la caratteristica % L'introduzione di 
raggruppamenti di documenti dà un significato al 
principio di sovrapposizione della QM nell'analogia 
con l'IR: qualsiasi combinazione lineare di vettore- 
documenti rappresenta a sua volta un vettore-do¬ 
cumento Un raggruppamento di documenti è rap¬ 
presentato come una sovrapposizione lineare dei 
vettori associati ai documenti appartenenti al rag¬ 


gruppamento. Le ampiezze di probabilità co. sono 
definite come la radice quadrata della frequenze di 
occorrenza di ciascun vettore del raggruppamento. 
Un raggruppamento C che comprende gli elementi 
C= { I I /= 1...N è quindi descritto come: 


numero di occorrenze di d 
- L (3) 

numero totale di vettori C 

dove I coj^ = 1 

Nel nostro esempio, seC = {|0>|0> |1> |1>|2>|, 

allora I C> I ^ 2 /J 0> +1 > +77/J 2> 

I documenti ed i raggruppamenti sono rappre¬ 
sentati in modo uniforme: sono tutti vettori nello 
stesso spazio y Questa rappresentazione ha più 
informazioni rispetto alla identificazione di un rag¬ 
gruppamento con il suo baricentro (o centroide), dal 
momento che il raggruppamento è ora associato 
per una distribuzione di probabilità. Nell'approc¬ 
cio usuale basato sullo "spazio metrico", un vettore 
relativo ad una interrogazione è associato al rag¬ 
gruppamento il cui centroide ha distanza minima 
dal vettore, rispetto ai centroidi degli altri raggrup¬ 
pamenti. Nel caso di una distribuzione fortemente 
sparsa dei vettori appartenenti al raggruppamento, 
è possibile che si producano errori di associazione. 

5. L'interrogazione q è un documento che deve 
essere assegnato a un raggruppamento ed è 
associata al concetto di stato di un sistema 
quantistico, perché induce misura di proba¬ 
bilità sui sottospazi dello spazio degli stati, 
come indicato dal teorema di Gleason, cioè 
assegna una probabilità di rilevanza di ogni 
corrispondenza documento/raggruppamento. 
E'rappresentato in ^da |q) 

6. La probabilità di rilevanza di un documento/ 
raggruppamento C rispetto aq è quindi: 

-P^{Q = \or.X= <q|Pjq> (4) 
dove è l'operatore di proiezione su |C ). 
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L'assegnazione di q a un raggruppamento è otte¬ 
nuto calcolando la somiglianza tra q e ogni vettore 
presente nel raggruppamento e scegliendo quello 
più simile. 

4. Realizzazione e Test 

Abbiamo sviluppato un prototipo software che im¬ 
plementa il metodo proposto di rappresentazione e 
attribuzione dei punteggi per le immagini digitali, 
caratterizzato dai seguenti Descrittori Visuali di 
MPEG-7: 

v" Scalable Color, con 64 coefficienti di Haar con 
piani a 8 bit; 

'4 Color Layout, con 6 coefficienti per la luminanza 
e 3 coefficienti per ogni crominanza; 

EdgeHistogram, con 5 tipi di bordi con suddivi¬ 
sione in 16 blocchi dell'immagine, dando origine 
ad 80 coefficienti. 

Nella prima fase, le immagini sono state rappresen¬ 
tate in uno "spazio metrico" come normalmente 
avviene in CBIR: ogni dimensione corrisponde ad 
un coefficiente/caratteristica e la somiglianza tra 
due documenti è inversamente proporzionale alla 
distanza tra i vettori. I vettori nella "spazio metrico" 
sono raggruppati utilizzando lo strumento Kmiocal 

[8] , adottando l'algoritmo K-means nell'implemen- 
tazione Hybrid. Questo strumento fornisce come 
risultato le coordinate del baricentro dei raggruppa¬ 
menti e l'assegnazione ai diversi raggruppamenti di 
ciascun documento che fa parte dell'insieme di dati. 

Nella seconda fase, è stato creato lo "spazio di Hil¬ 
bert" in base al modello descritto nella Sezione 3. 

Per testare l'applicazione, è stato utilizzato un insie¬ 
me di dati costituito da 18.461 immagini selezionate 
in modo casuale a partire dalla collezione CoPhIR 

[9] , dove le immagini sono caratterizzate mediante 
i Descrittori Visuali MPEG-7. Le immagini sono state 
organizzate in 1846 raggruppamenti: tale numero è 
stato scelto in base a una regola empirica. Abbiamo 
scelto 12 immagini fra quelle disponibili nell'insieme 
per effettuare le interrogazioni e abbiamo ottenuto 


l'assegnazione ad uno dei raggruppamenti in base 
ai due metodi: il "metodo metrico "(assegnazione 
calcolato al momento della creazione del raggrup¬ 
pamento) ed il "metodo Hilbert", per il quale abbia¬ 
mo creato la rappresentazione della interrogazione 
e dei raggruppamenti nello spazio di Hilbert, e 
successivamente il punteggio per ciascuna interro¬ 
gazione nei confronti di ciascun raggruppamento 
utilizzando l'algoritmo rappresentato dall'equa¬ 
zione (4). L'interrogazione viene assegnata al 
raggruppamento che ottiene il punteggio più alto. 

Nel nostro esempio è preso in considerazione un 
raggruppamento C che comprende 10 membri. Si 
presume che vi sia un coefficiente. Colore Scalabile 
0, che può assumere solo i valori interi da -19 a 20: 
lo spazio di Hilbert ha 40 dimensioni. L'avere 

significa che di C fanno parte 2 immagini con Co¬ 
lore Scalabile 0 pari a 11, 5 immagini il cui valore 
della caratteristica considerata è 12, e 3 immagini 
in cui vale 13. Gli altri vettori che costituiscono la 
base hanno un coefficiente nullo e pertanto non 
compaiono nella sovrapposizione. 

A causa del fatto che l'insieme di dati non presenta 
una evidente struttura organizzata in raggruppa¬ 
menti, i raggruppamenti creati non sono facilmente 
identificatibi in base ad un contenuto o un soggetto 
specifico. 

Ciò è la causa della presenza di un rumore di fondo 
nei risultati ottenuti: non è stato possibile valutare 
alcune delle assegnazioni a causa della scarsa qua¬ 
lità dei raggruppamenti. 

Inoltre, poiché i raggruppamenti sono stati creati 
appositamente per effettuare il test, alle interroga¬ 
zione è stata associata una pre-assegnazione. Ciò 
implica che le assegnazioni devono essere valutate 
visivamente, con un confronto qualitativo tra i due 
metodi, ottenuta visualizzando ogni immagine og¬ 
getto di interrogazione nel contesto del raggruppa¬ 
mento. I risultati di questa valutazione visiva sono 
riportati in tabella 1. 
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5. Conclusioni e lavoro futuro 

Questo lavoro fornisce due contributi principali. 

Il primo è costituito dalla definizione di un mo¬ 
dello per la rappresentazione di documenti per 
mezzo delle loro caratteristiche, rappresentate in 
uno spazio di Hilbert, costruito in analogia con lo 
spazio degli stati della meccanica quantistica (QM). 
Le caratteristiche sono rappresentate da operatori 
hermitiani, i cui autovalori sono i possibili valori 
delle caratteristiche. L'interrogazione è associata 
al vettore di stato della QM, in quanto essa deter¬ 
mina la probabilità che la misura di un'osservabile 
risulti in un certo autovalore. Questa probabilità è 
interpretata come somiglianza tra il documento og¬ 
getto dell'interrogazione e ognuno dei documenti 
compreso nell'insieme dei dati. Il ruolo del principio 
di sovrapposizione nell'applicazione IR è ottenuto 
con l'introduzione di raggruppamenti di immagini, 
rappresentati dalle combinazioni lineari dei vettori 
che costituiscono i raggruppamenti. Le immagini, 
i raggruppamenti e le interrogazioni sono quindi 
rappresentati in modo uniforme come vettori dello 
stesso spazio di Hilbert. 


Il secondo contributo è il prototipo di applicazione 
software, che realizza il metodo proposto per le im¬ 
magini digitali utilizzando il formato dei Descrittori 
Visuali MPEG-7 per individuare le caratteristiche 
visive. Il prototipo software crea lo spazio di Hilbert 
e calcola l'assegnazione di un documento oggetto 
di interrogazione ad uno dei raggruppamenti. Il test 
dell'applicazione fornisce una valutazione qualitati¬ 
va di tale assegnazione se confrontata con il metodo 
normalmente adottato, basato sul baricentro. 

La sperimentazione del nuovo metodo ha dato 
buoni risultati per la maggior parte delle interro¬ 
gazioni, ma sono necessari ancora miglioramenti 
in molti aspetti. In particolare, è necessario utiliz¬ 
zare un insieme di immagini con una struttura con 
raggruppamenti meglio definiti, collegata con un 
insieme di dati altamente affidabili. In questo modo 
sarebbe possibile una valutazione quantitativa. Le 
interrogazioni dovrebbero basarsi su immagini non 
utilizzate nella fase di rggruppamento ed i parame¬ 
tri dell'algoritmo K-means dovrebbero subire una 
messa a punto, in particolare per quanto riguarda il 
numero di raggruppamenti. Infine, il nuovo metodo 
dovrebbe essere utilizzato anche per la creazione 
dei raggruppamenti. 


N 

identificatore 
interrogazione 
(query Id.) 

Valutazione visiva 

1 

9656496 

/ raggruppamenti sono simili, dal punto di vista visivo 

2 

35404821 

Stesso raggruppamento 

3 

67528271 

L'asseganzione con il metodo dello spazio di Hilbert non è visualmente buono 

4 

24869474 

Stesso raggruppamento 

5 

67154639 

Le due assegnazioni evidenziano elementi differenti delle immagini 

6 

67867803 

Stesso raggruppamento 

7 

5042589 

Stesso raggruppamento 

8 

5042740 

Stesso raggruppamento 

9 

67479156 

L'assegnazione mediante sistema metrico è visualmente migliore 

10 

24567694 

Stesso raggruppamento 

11 

35685661 

Il processo di raggruppamento non è avvenuto correttamente 

12 

41930413 

Il processo di raggruppamento non è avvenuto correttamente 


Tab. 1 - Valutazione visiva confrontando le assegnazioni delle interrogazione coni metodi "metrico" e 
di "Hilbert". I “query Id"sono i nomi che identificano i file nella collezione CoPhIR. 
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Non tutti i postulati della QM trovano un'applicazio¬ 
ne nell'analogia con TIR, in particolare, al momento 
non è stato trovato un significato per l'esistenza di 
operatori non commutanti e per l'introduzione di un 
evoluzione hamiltoniana nell'applicazione. 

Un eventuale lavoro futuro dovrebbe focalizzarsi 
sul feedback della pseudo-rilevanza, per seguire in 
modo automatico le scelte e gli interessi dell'uten¬ 
te. Se un utente effettua una interrogazione a un 
sistema, i primi k vettori risultanti possono essere 
rappresentati come un raggruppamento-sovrappo¬ 
sizione l'immagine oggetto dell'interrogazione può 
essere ruotata in questo sottoinsieme di ordine k, 
al fine di riapplicare un ulteriore interrogazione, in¬ 
dirizzata con maggiore precisione a rispondere alle 
esigenze dell'utente. L'approccio presentato risulta 
ancor più utile quando tipi differenti di documenti 
sono presenti nei raggruppamenti, come metadati 
e video. Caratteristiche locali sono rilevanti, come, 
ad esempio le SIFT [10]. MPEG sta per analizzare e 
standardizzare le caratteristiche locali come Descrit¬ 
tori Compatti per la Ricerca Visuale (gruppo CVDS). 
Questi nuovi descrittori possono trarre beneficio 
dall'approccio di sovrapposizione per tener conto 
di tutte le caratteristiche visuali estratte dall'im¬ 
magine. Un'ulteriore indagine potrebbe valutare 
possibili applicazioni di IR alle proprietà algebriche 
di osservabili incompatibili e di una evoluzione 
hamiltoniana di un sistema. 
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3D-VMS Virtual Microphone System 
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Sommario 

Il sistema 3D-VMS, oggetto di precedenti articoli, 
ha recentemente beneficiato di miglioramenti, dal punto di 
vista sla tecnologico sla operativo. Il sistema è stabile per guanto 
riguarda lo sviluppo teorico, ma è tuttora In fase di evoluzione, grazie al 
miglioramenti offerti dalla piattaforma tecnologica. 

Le caratteristiche di affidabilità e di gualltà offerte, valutate realizzando 
sperimentazioni con varie tipologie produttive e di ripresa, sono state 
giudicate molto Interessanti e la Rai ha utilizzato per la prima 
volta II sistema per la ripresa e trasmissione In diretta In occa¬ 
sione della diffusione dell'Opera Lucia di Lammermoor, 
su Rai Radio 3 e sulla rete Euroradio. 


1. L'Evoluzione 

Il sistema denominato 3D-VMS, basato sulla teoria Ambisonic, utilizza una 
sonda a più capsule per realizzare la ripresa multimicrofonica e consente 
di posizionare più punti di ripresa sul piano azimutale e mediano (fino 
a 7 microfoni virtuali). 

Il sistema, descritto in precedenti articoli [1 ,2], è oggetto di evoluzione 
dal punto vista sia della configurazione hardware, sia dell'interfaccia 
utente. 

La configurazione illustrata in [2] comprendeva una sonda microfonica 
collegata con l'interfaccia EMIB all'unità di elaborazione (in pratica un 
PC quad-core) dei segnali controllata da una console (un MacBook). 

Dal punto di vista hardware, l'evoluzione del sistema consente ora di 
affidare ad un MacBook quad-core di svolgere sia le funzioni di unità di 
elaborazione sia di console che provvede alla GUI. 
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Questa innovazione è molto importante, sia dal pun¬ 
to di vista operativo, perché semplifica parecchio il 
compito del tecnico dedicato a gestire il sistema, sia 
per lo sviluppo delle potenzialità future. 

Sarà possibile avere una sincronizzazione audio/ 
video di servizio tramite due"gruppi"di segnali che 
viaggiano su cavo IP e sarà facilitata l'introduzione 
del Time Code, il codice temporale necessario alla 
sincronizzazione dei segnali audio provenienti dalla 


d - Selezione e scelta del dispositivo 
audio collegato al MacBook 



sonda con i segnali video provenienti dalle teleca¬ 
mere utilizzate durante le riprese televisive. 

Le prestazioni del sistema sono state giudicate adat¬ 
te per la sua utilizzazione per la ripresa dell'opera 
"Lucia di Lammermoor" al Teatro Regio di Torino, 
diffusa in diretta su Rai Radio 3 sulla rete Euroradio. 

2. La Nuova Interfaccia 

I suggerimenti dei colleghi della Produzione sono 
stati importanti per consentire il miglioramento 
notevole dell'interfaccia utente, fino a pervenire 
alla versione attuale. Le novità dal punto di vista 
operativo hanno consentito di realizzare le prove 
di registrazione e di montaggio e infine di adottare 
il sistema per la diffusione in diretta. 

In figura 1 è rappresentata l'interfaccia di post¬ 
produzione che presenta, come elemento centrale, 
una fotografia della scena che"abbraccia"un campo 
visivo da 360° azimutali. 


Fig. 1 - Impostazioni in 
post-produzione. 
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c - Selezione del microfono 


a - Gestione del brano 


b - Gestione di posizionamento spaziale 
e zoom dei singoli microfoni virtuali 
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Si possono notare alcune peculiarità di cui la vecchia 
interfaccia non era provvista: 

la possibilità di visualizzare i minimi di guada¬ 
gno dei microfoni virtuali, rappresentati come 
'X'iNotch); 

le circonferenze, che rappresentano le quan¬ 
tità di profondità di guadagno (la direttività), 
corrispondono ad una attenuazione rispetto al 
centro pari a 6 dB; 

è possibile andare in P/oy, Pause e Stop durante 
l'analisi del segnale audio, controllando il segna¬ 
le in qualunque momento (a); 

si può agire nei"campi"/Az;/Duf,f/evof;on e Order 
anche impostando direttamente i valori (b); 

attivando Selection Button/Mouse si seleziona 
uno dei microfoni in scena; nella versione pre¬ 
cedente, essendo i cerchi vicini tra loro, poteva 
accadere che la selezione, e il conseguente 
movimento, agisse su un microfono diverso da 
quello voluto (c); 

si può agire sul guadagno di ingresso al Mac, 
nella sua funzione di registratore audio, attra¬ 
verso un dosatore virtuale; 

inoltre si ha il monitoraggio dei livelli dei 32 
microfoni, aprendo ad es. il software di regi¬ 
strazione P/ogue 6/c/u/e e selezionando Mon/for; 

si può scegliere il dispositivo audio da utilizzare 
(d), tra RME Fireface 400 o 800, EMIB o il MacBo- 


Acronimi e sigle 


3D-VMS 

3D - Virtual Microphone System 

AIDA 

Advanced Industriai Design in Acoustic 

EBU 

European Broadcasting Union 

EMIB 

Eigenmike® Microphone Interface Box 

GUI 

Graphic Use Interface 

HOA 

High Order Ambisonic 


ok stesso (in questo caso per due soli microfoni 
virtuali); 

Anche l'interfaccia utente relativa al Real-Time è 
stata rivoluzionata (figura 2), dotandola di funzio¬ 
nalità analoghe a quelle disponibili per la post¬ 
produzione: 

^4 è possibile scegliere il numero di microfoni con 
cui operare (1,2 o 7); 

^4 il microfono è selezionabile mediante Selection 
Button/Mouse; 

>4 posizione e direttività del microfono è imposta¬ 
bile direttamente nei rispettivi campi; 

'/ è possibile avere un'idea dello zoom impostato 
osservando nell'apposita finestra il diagramma 
polare del microfono scelto; 

'/ il livello di registrazione è impostabile agendo su 
un dosatore virtuale, in modo da non rischiare 
di saturare il segnale portandolo in distorsione. 


Fig. 2 - Impostazioni in 
Real-Time 
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3. I TEST 

3.1 Rigoletto 

La ripresa effettuata al Teatro 
Regio delle prove generali del 
"Rigoletto" di Giuseppe Verdi 
(figura 3) è stata realizzata con 
una sola sonda microfonica 
posta al centro, sul bordo del 
palco, allo scopo di riprendere 
sia le voci frontali, sia l'orche¬ 
stra, localizzata posteriormen¬ 
te rispetto alla sonda. 



Fig. 3 - Torino, 9 aprile 2011. Prove generali del "Rigoletto"al Teatro Regio. 


Quando si è analizzato il risultato in post-produzio¬ 
ne i microfoni virtuali sono stati posizionati come 
illustrato in figura 4. 

Il risultato sonoro del fronte acustico del cantato è 
molto buono: le voci sono così "presenti" che si ha 
l'impressione che i cantanti siano dotati di radiomi- 
crofono individuale. In complesso, si ha un'aria del 
palco non invasiva e gradevole nella giusta misura 
e la spazialità delle voci corrisponde al reale ed è 
piacevole. 


Per quanto riguarda l'orchestra, invece, il risultato 
non è sufficiente, come d'altronde ci si aspettava. 
Si avverte infatti che i suoni degli strumenti non 
arrivano direttamente alla sonda microfonica, ma 
riflessi dalle pareti della fossa: non sono suoni otte¬ 
nuti mediante microfoni puntati direttamente, sui 
percorsi delle onde sonore generate dagli strumenti 
musicali. 

Questa esperienza ha permesso di individuare una 
configurazione ottimale di ripresa, messa in atto 
successivamente, per la "La Traviata". 
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Fig. 4 - Impostazione 
grafica per la ripresa 
del "Rigoletto". 
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Fig. 5 - Torino, 20 aprile 2011. Prove generali de "La Traviata" al Teatro Regio. 

30-VMS Rayback Interface (- by A.Capra -1 



© ® ® 


Fig. 6 - Impostazione grafica per il palco de "La Traviata". 



3.2 La Traviata 

Per la ripresa delle prove generali 
de "La Traviata" di Giuseppe Verdi 
(figura 5) sono state utilizzate due 
sonde microfoniche: una posizio¬ 
nata nello stesso luogo scelto per il 
"Rigoletto", al centro, sul bordo del 
palco, e una posta alle spalle del 
Direttore d'Orchestra e orientata 
verso il centro della fossa. 

Nelle figure 6 e 7 sono illustrate 
le impostazioni per le due sonde: 
quella orientata verso il palco e 
quella orientata verso la fossa. 

Il risultato sonoro è nettamente 
superiore, per quanto riguarda il 
contributo della fossa, rispetto a 
quello ottenuto per il "Rigoletto": 
gli strumenti sono più presenti 
e più "puliti", anche se cambia 
indubbiamente il modo di senti¬ 
re l'orchestra. Gli strumenti non 
vengono percepiti come se fossero 
singolarmente "a fuoco", come nel¬ 
la tecnica di ripresa multimicrofo- 
nica, ma in modo simile all'ascolto 
reale, davanti all'Orchestra. 

Per quanto riguarda il risultato 
relativo al palco, è molto buono e 
fornisce le stesse sensazioni prece¬ 
dentemente osservate. 

Un potenziale problema potrebbe 
nascere dalla somma dei contributi 
delle voci sulle due sonde, influen¬ 
zata dai percorsi differenti degli 
stessi. Dal punto di vista tecnico le 
sonde, poste a distanza di circa 6 
metri tra di loro, riprendono lo stes¬ 
so suono, ma con un certo ritardo. 
All'ascolto questo fenomeno non 
è risultato udibile, probabilmente 
grazie all'acustica del Teatro e al 
puntamento ottimale dei microfo¬ 
ni virtuali relativi alla fossa. 


Fig. 7 - Impostazione grafica per la fossa d'orchestra de "La Traviata". 


www.crit.rai.it 


Elettronica e Telecomunicazioni N° 2 Agosto 2011 


27 


























Fig. 8 - Torino, 21 giugno 2011. 
"Lucia di Lammermoor"al 
Teatro Regio. 


L'effetto surround è stato ottenuto utilizzando i con¬ 
tributi forniti dai microfoni virtuali 4 e 5 sintetizzati 
dalla sonda relativa al palco (figura 6), mentre non 
sono stati utilizzati i contributi della sonda relativa 
alla fossa, perché influenzati fortemente dalla su¬ 
perfìcie riflettente costituita dal muro alle spalle 
del Direttore. 


4. Inonda 

4.1 Lucia di Lammermoor 

Dopo l'attenta valutazione dei risultati dei test pre¬ 
cedentemente descritti, la Rai ha deciso di utilizzare 
il sistema 3D-VMS nel corso della ripresa della"Lucia 
di Lammermoor"di Gaetano Donizetti (figura 8). 



Fig. 9 - Impostazione grafica per la "Lucia di Lammermoor". 


L'opera è stata trasmessa in 
diretta da Rai Radio 3 ed è 
stata distribuita da Eurora- 
dioNotai. Infatti è uno dei 324 
concerti che costituiscono 
VEuroradio Summer Festival 
del 2011. 

In figura 9 è riprodotta l'im¬ 
postazione grafica dei mi¬ 
crofoni virtuali definita du¬ 
rante le prove e mantenuta 
durante la diretta. 

Nota 1 - Euroradio è la 
rete di scambio di pro¬ 
grammi audio digitali di 
alta qualità dell'EBU. 
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Il sistema 3D-VMS è stato adottato per la ripresa 
del palco, mentre la ripresa dell'orchestra è stata 
effettuata in modalità classica multimicrofonica. 

Il suono generato dal sistema 3D-VMS è pieno, pia¬ 
cevole, con mancanza di fading (graduale aumento 
o decremento del livello del segnale sonoro dovuto 
al passaggio di copertura da un microfono a quello 
adiacente), ottima continuità di ripresa in scena e 
ottima disposizione in profondità e ampiezza delle 
voci che si svolgono sul palcoscenico. 

I segnali elaborati dal sistema 3D-VMS sono consi¬ 
derati alla stessa stregua di segnali provenienti da 
microfoni posti in scena e mixati insieme a quelli 
provenienti dai microfoni posti nella fossa (figura 
10 ). 

II ritardo dei segnali elaborati dal sistema 3D-VMS 
rispetto a quelli reali è di 134 ms. Di conseguenza 
è stato introdotto un ritardo analogo sui segnali 
provenienti dai microfoni convenzionali. 


5. Eventi non ancora analizzati 

Citiamo due ulteriori eventi, che saranno oggetto 
nel prossimo futuro di analisi con il sistema 3D-VMS 
in post-produzione. 

Il 16 maggio 2011 presso lo Studio 3 del Centro 
di Produzione TV Rai di Milano è stata ripresa la 
West-Eastern Divan Orchestra diretta dal M° Daniel 
Barenboim. Sono state eseguite due parti estrapo¬ 
late dalla "Eroica" di Beethoven e dalla "Patetica" di 
Tchaikovsky, diffuse nel corso della puntata di "Che 
tempo che fa"condotta da Fabio Fazio su Rai 3. 

La sonda microfonica è stata sospesa all'altezza dei 
proiettori luci sopra l'orchestra. 

Il 29 giugno 2011, in collaborazione con Radio Vati¬ 
cana, è stata realizzata la ripresa della celebrazione 
della Santa Messa da parte di Sua Santità presso la 
Basilica di San Pietro in Vaticano, con la partecipa¬ 
zione del Coro e dell'Orchestra di Santa Cecilia e 
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del Coro della Sistina dello Stato Città del Vaticano, 
diretto da Don Massimo Palombella. 

Le riprese audio sono state effettuate sia dalla Radio 
Vaticana, sia dalla Rai. La Rai ha utilizzato due mi¬ 
crofoni 3D-VMS, e un microfono Holophone H2Pro. 

Ringraziamenti 

Un particolare ringraziamento va a tutti coloro che 
hanno reso possibile le riprese degli eventi oggetto 
di questo articolo, in particolare: la Radio Vaticana 
per l'organizzazione e la disponibilità presso la Basi¬ 
lica di San Pietro; i responsabili e i tecnici del Teatro 
Regio di Torino per le riprese del "Rigoletto"e de "La 
Traviata"; i colleghi della Rai Andrea Canino, Mau¬ 
rizio Trevisan, Roberto Cotto e Luca De Murtas per 
aver effettuato ripresa, mixaggio e messa in onda 
della "Lucia di Lammermoor", l'assistente musicale 
Felice Marenco per la valutazione dei risultati; il 
collega del Centro Ricerche Rai Enrico Cavallini per 
il supporto sugli impianti e le riprese fotografiche 
durante tutti i test svolti. 


Il sistema 3D-VMS, basato sulla tecnica Ambisonic, 
è frutto della attività di ricerca effettuata dal Centro 
Ricerche della Rai in stretta collaborazione con il 
prof. Angelo Farina e l'ing. Andrea Capra del Dipar¬ 
timento di Ingegneria Industriale dell'Università di 
Parma. 
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Questo articolo è parte della raccolta de LeMiniSerie 
sulle tecniche ed i sistemi di ripresa e produzione mul- 
timicrofonica basati sulle teoria Olofonica e Ambisonic. 

La raccolta, comprendente articoli pubblicati a partire 
dall'agosto 2007, illustra le attività condotte presso il 
Centro Ricerche e Innovazione Tecnologica della Rai 
per approfondire le basi teoriche dei due sistemi, ma 
soprattutto per sperimentarle in una ampia gamma di 
condizioni di ripresa. 

Lo studio ha portato alla definizione del sistema 3D- 
VMS, basato sulla teoria Ambisonic, oggetto di brevetto 
da parte della Rai e dell'AlDA, sp/n-off dell'Università 
di Parma. 
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TAV: la Televisione ad Alta Velocità 

Aspetti realizzativi per distribuire la 
TV digitale a bordo di treni ad alta velocità 


Andrea Bertella, Vittoria Mignone, Silvio Ripamonti, 
Bruno Sacco, Mirto Tabone e Giovanni Vitale 
Rai - Centro Ricerche e InnovazioneTecnologica 

Giuseppe Braccini, 
Rai Way 


Sommario 

I treni ad alta velocità sono utilizzati molto spesso come uffici viaggianti; in molti casi il viaggio 
in treno è vissuto come un momento di relax, così come accade durante gli spostamenti aerei. 
Qualungue sia lo stile del nostro viaggio, il poter accedere a contenuti TV live informativi o di 
intrattenimento rappresenta senza dubbio un arricchimento notevole dei servizi offerti a bordo. 

II Centro Ricerche della Rai ha realizzato, su richiesta di RaiWay, uno studio di fattibilità per un 
sistema che fornisca un servizio di ricezione TV e radio digitale con programmi Rai a bordo dei 
treni ad alta velocità. 




1. Introduzione 

La concorrenza nel settore del trasporto ferroviario 
ad alta velocità ha stimolato la ricerca, anche da 
parte dei nuovi operatori, di servizi innovativi che 
arricchiscano l'offerta ai viaggiatori. 

In questo contesto Rai Way S.p.A., la società del 
gruppo Rai che possiede e gestisce le infrastrutture 
di trasmissione e diffusione del segnale radiotelevi¬ 
sivo e che sta svolgendo un ruolo primario nel pas¬ 
saggio al digitale terrestre televisivo, ha individuato 
una interessante opportunità per valorizzare il pro¬ 
prio know-how la cui eccellenza viene riconosciuta 
anche in ambito internazionale. 

L'idea consiste nell'estendere il servizio radiote¬ 
levisivo, nella sua nuova veste digitale, anche ai 


viaggiatori in treno, che potranno così trascorrere 
il tempo di viaggio in maniera rilassata, come se 
fossero sul divano di casa propria potendo fruire, 
in reai time, di news, eventi sportivi e programmi 
di intrattenimento. 

Il servizio si andrebbe ad aggiungere agli altri servizi 
digitali (telefonia e broadband) già disponibili a 
bordo dei treni, ed in via di potenziamento, destinati 
maggiormente ad un'utenza di tipo business. 

Su questo tema è stata pertanto elaborata dal 
Centro Ricerche Rai, su richiesta e in collaborazione 
con l'unità organizzativa Sviluppo Business di Rai 
Way, una ipotesi di soluzione ad alto contenuto di 
innovazione che integra sinergicamente collaudate 
tecnologie già impiegate nel settore del digitale 
terrestre televisivo. 
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2. Risultati degli studi precedenti 

Il progetto FIFTH [1], a cui ha partecipato il Centro 
Ricerche e si è concluso nel 2003, ha studiato la 
possibilità di distribuire programmi televisivi su 
treni ad alta velocità. La soluzione da esso proposta 
consiste nell'aggiungere un segnale dedicato da 
satellite, con due caratteristiche: 

• basso bitrate, per minimizzare il costo del sa¬ 
tellite, 

• contenente due flussi gemelli, ma sfalsati di 10 
minuti. 

Grazie alla seconda caratteristica, il primo flusso rice¬ 
vuto è memorizzato in un buffer, mentre il secondo 
flusso è quello normalmente distribuito all'utente. 
In caso di interruzioni (ostacoli brevi o anche gal¬ 
lerie più o meno lunghe) nel buffer di ricezione è 
comunque presente la replica e si può così ovviare 
alla mancanza di dati. Ciò implica che le gallerie de¬ 
vono essere percorse in meno di 10 minuti, in caso 
contrario viene a mancare il contributo sostitutivo 
offerto dalla diversity temporale. 

Il sistema sopra citato soffre di alcuni limiti: 

@ scarsa offerta di programmi (ne è previsto uno 
solo in caso di ricezione comunitaria, e quattro 
in caso di ricezione individuale); 

@ limitata qualità video; 

©costi di gestione per l'affitto del transponder 
satellitare (in realtà è utilizzata una frazione della 
capacità del transponder per ridurre il costo). 

3. Obiettivi e vincoli 

PER IL NUOVO STUDIO 

L'obiettivo iniziale di questo studio consiste nell'in- 
dividuare soluzioni atte a fornire agli utenti sui treni 
ad alta velocità la ricezione, collettiva e individuale, 
di programmi televisivi e radiofonici con un'offerta 
ampia, e qualità video comparabile a quella di una 
ricezione fissa domestica, senza ulteriori spese per 
l'affitto di segmenti satellitari. 

Questo studio di fattibilità ha lo scopo di confrontare 
le possibili soluzioni con quella considerata in FIFTH 


Acronimi e sigle 

ASI-TS 

Asynchronus Serial Interface - 
Transport Stream 

AVC 

Advanced Video Coding , nota anche 
come H.264 

CRC 

Cyclic Redundancy Check 

DVB 

Digital Video Broadcasting 

FEC 

Forward Error Correction 

FIFTH 

Fast internet for FastTrains Flosts 

GSM-R 

Global System for Mobile 

Communications - Railway 

IP 

Internet Protocol 

MPE-FEC 

Multi Protocol Encapsulation - FEC 

SCPC 

Single Channel Per Carrier 

TS 

Transport Stream 


e valutarle dal punto di vista costi/benefici, anche 
in funzione dei requisiti più o meno stringenti presi 
in considerazione. 

3.1 Copertura 

Il servizio dovrebbe essere operante lungo tutta la 
linea ferroviaria percorsa dai treni interessati: 

• le tratte a cielo aperto, servite dal segnale sa¬ 
tellitare; 

• le tratte in galleria; 

• il transito e la sosta nelle principali stazioni. 

3.2 Integrazione con servizi esistenti 

L'infrastruttura di bordo e quella fissa in galleria 
devono integrarsi per quanto possibile con gli im¬ 
pianti esistenti: 

• A bordo del treno esistono precisi vincoli: di 
dimensioni e di assorbimento per gli apparati; 
vincoli geometrici e meccanici per antenne e 
cablaggi; le interconnessioni tra i vagoni do¬ 
vrebbero essere evitate. 

• In galleria esistono strutture radianti a larga 
banda (cavi fessurati) per applicazioni GSM-R. 
Gli apparati potranno condividere tali strutture 
e quindi integrarsi con i relativi impianti. 
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4. Approccio "Bouquet esistente" 

4.1 Requisiti del servizio 

Nell'ottica di fornire all'utente un'offerta ampia, 
compatibilmente con costi e complicazione dell'in- 
frastruttura, si pensa di utilizzare parte del bouquet 
TivùSat. Un esempio di programmi televisivi possi¬ 
bili candidati è indicata in tabella 1. Con tale scelta 
i transponder da ricevere sono 4 per ottenere 8 
programmiTV, oppure 3 per ottenerne 7. Nel primo 
caso, tuttavia, si otterrebbero anche, ad esempio, 
i 4 programmi radiofonici Rai indicati in tabella 2. 

4.2 Architettura di riferimento 

Sulla base dei requisiti di progetto precedentemen¬ 
te introdotti è stata ideata da Rai Way l'architettura 
illustrata in figura 1. 

A bordo del treno si tratta di ridistribuire i program¬ 
mi televisivi e radiofonici, ricevuti ad esempio dalla 
piattaforma satellitare diTivùSat, tramite lo standard 


Programma 

televisivo 

Mux Sat 

RaiUno 


RaiDue 

D 10.992 V Mediaguard/Nagravision 3 

RaiTre 


Rai News 24 

D 11.804V 

Rete 4 


Canale 5 

D n.919V Mediaguard 2/Nagravison 3 

Italia 1 


La 7 

D 11.541 V Nagravision 3 


Tab. 1 - Un esempio di programmi televisivi candidati 
alla distribuzione sui treni ad alta velocità. 


Programma 

radio 

Mux Sat 

Radio 1 

Radio 2 

Radio 3 

Isoradio 

D 11.804V 


Tab. 2 - Un esempio di programmi radiofonici, fra 
quelli presenti nel bouquet TivùSat. 


Ricezione satellitare 


TX interno 
Banda 


Audio indivividuale 


Fig. 1 - Architettura di riferimento per la ricezione del segnale 
da satellite e distribuzione in galleria e a bordo treno. 


i Deviatore i 
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Jocale^ 
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Fig. 2 - Distribuzione del segnale DVB-T in galleria.. 


Antenna ricezione satellitare 
con sistema di autopuntamento 


DVB-S 
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diffusione interno carrozze 
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Fig. 3 - Schema dettagliato della distribuzione del segnale DVB-T in galleria e commutazione del segnale. 
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DVB-T [2,3] mediante un trasmettitore a bassissima 
potenza (banda NI) (figura 2). Quando il treno si trova 
a transitare in campo libero i programmi televisivi 
sono ricevuti dal satellite da n transponder e riposi¬ 
zionati su m blocchi DVB-T (nell'ipotesi di partenza 
n=8, m=8). 

In galleria la continuità di trasmissione a bordo 
treno verrebbe garantita da una ritrasmissione 
dello stesso segnale con la medesima modalità 
DVB-T in cavo radiante (fessurato); gli spezzoni di 
cavo radiante (di circa 550-1-550 m) sono alimentati 
amplificando un segnale distribuito su fibra ottica 
generato all'imbocco della stessa. 

In prossimità della galleria, in ingresso ed in uscita, 
un radiocomando di prossimità fornirebbe il coman¬ 
do di passaggio dalla modalità satellite alla modalità 
galleria e viceversa. In figura 3 è rappresentato lo 
schema funzionale degli apparati. 

4.3 Aspetti realizzativi e criticità 

Segue una rassegna dei potenziali problemi e im¬ 
plicazioni relativi alla realizzazione. 

4.3.1 DoWNLINK SATELLITE 

La tecnologia DVB-S appare un'ottima candidata. 
Tuttavia esistono criticità relative ai seguenti aspetti: 

• Antenna: è richiesto un sofisticato sistema 
d'antenna con puntamento e inseguimento (tra- 
ckìng) automatico.Tecnicamente il problema è 
già stato affrontato ed è disponibile un prodotto 
già collaudato. Per quanto riguarda la singola 
antenna (come si vedrà, in realtà risulterebbe 
necessaria una coppia di antenne per ogni 
treno), la criticità è relativa alla sistemazione 
meccanica e al costo. 

• Effetto Doppler: l'antenna richiesta è sufficien¬ 
temente direttiva da escludere la presenza di 
multipath (riflessioni da ostacoli) con effetto 
Doppler. L'effetto Doppler presente è relativo 
al solo segnale diretto, per il movimento reci¬ 
proco tra satellite e treno. Nell'analisi eseguita 
nel progetto FIFTH è considerato l'utilizzo di un 
sistema di compensazione per l'effetto Doppler. 


• Blocking e Shadowing: dovuto a ostacoli: an¬ 
che su questi aspetti l'analisi fatta nel progetto 
FIFTH è approfondita e circostanziata da prove 
su campo. Un supplemento di prove di labora¬ 
torio è stato recentemente eseguito dal Centro 
Ricerche, per valutare qual'è la massima durata 
della microinterruzione tollerata dal sistema 
DVB-S [4], e l'influenza della frequenza di ripe¬ 
tizione dell'evento. I dettagli sono riportati in 
appendice A. In buona sostanza comunque si 
evince che l'estensione della microinterruzione 
è dell'ordine dei centimetri (con treno in corsa). 
Potenzialmente quindi ostacoli anche piccoli 
possono causare problemi. 

Si conclude, in accordo con i risultati di FIFTH, che 
in assenza di ulteriori contromisure la (singola) rice¬ 
zione satellite non è in grado di garantire il servizio 
in presenza di microinterruzioni dovute ai tralicci 
che sostengono la linea di alimentazione. Altri tipi 
di ostacoli (alberi, pali, ponti, ...), per quanto più 
sporadici, causano analoghe microinterruzioni. 

Le contromisure includono: 

1. Diversity di spazio: occorrono due antenne 
e relativi ricevitori: i segnali ottenuti vengono 
commutati (sistema più semplice) o combinati 
(più complicato perché richiede la messa in 
fase dei segnali, che potrebbe risultare critica) 
per ottenere un segnale ridondato. La prote¬ 
zione ottenibile è tanto maggiore (in termini 
di estensione della zona d'ombra) quanto più 
distanti sono le due antenne. Le possibilità 
sono: 

• Antenne montate sullo stesso vagone (es. 
motrice di testa): la protezione ottenibile 
è un po'inferiore, in quanto ponti larghi (e 
ostacoli simili) possono mettere in ombra 
entrambe le antenne contemporaneamen¬ 
te, ma il cablaggio risulta molto semplificato. 

• Antenne montate su carrozze distanti (ad 
esempio, le due motrici, di testa e di coda): 
in questo caso la protezione è più elevata, 
ma il cablaggio si complica molto in quanto 
i segnali ricevuti devono essere convogliati 
in un unico punto per effettuare la commu¬ 
tazione e da qui la successiva distribuzione. 
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2. Diversity di tempo: Questo approccio non 
consente la compatibilità con il segnale DVB/S 
ed è analizzato nella sezione 5. 

3. Interleaving di tempo: consiste neN'inserire un 
buffer di dati (time deinterleaver) sufficiente- 
mente grande: l'interruzione causa la perdita di 
dati, ma se i dati persi sono una percentuale ra¬ 
gionevolmente piccola di quelli contenuti nel 
buffer, un potente codice a correzione d'errore 
può recuperare i dati persi. Purtroppo questo 
metodo richiede un buffer gemello e inverso 
in trasmissione ("time interleaver") e ciò non 
è fattibile, se come requisito si richiede che 
l'head-end di trasmissione sia standard DVB/S, 
come quello TivùSat. Un approccio basato 
sull'uso della combinazione Time Interleaver 
e Upper Layer FEC, possibile adottando lo 
standard DVB/H, è analizzato nella sezione 6. 

Fra le contromisure indicate, e adottando l'archi¬ 
tettura di riferimento precedentemente esposta, 
l'unica possibile è la diversity di spazio (antenna di¬ 
versity), purtroppo carattezzata da un elevato costo. 

4.3.2 Galleria (installazioni fisse) 

Cavo fessurato 

Le gallerie sono attualmente già allestite con una 
distribuzione del segnale RF del servizio GSM-R, 


tramite cavo fessurato. L'assunzione che tale cavo 
possa operare anche sulle bande televisive è ragio¬ 
nevole, sebbene sia da verificare, poiché dipende 
dal tipo di cavo posato. 

La banda di frequenza candidata alla diffusione in 
galleria è la Banda III (174-230 MFIz). Questa scelta 
è ragionevole, per minimizzare l'effetto Doppler. 

Il segnale è distribuito in segmenti da 1100 m di 
cavo, alimentato al centro di ciascun segmento. 
Questa configurazione permette di ottenere una 
limitata attenuazione del segnale. Secondo stime 
ragionevoli l'attenuazione del cavo su 550 m si 
aggira intorno ai 7 dB, alle frequenze considerate. 
Di conseguenza, con il ricevitore in movimento, si 
può stimare una fluttuazione del livello del segnale 
di soli 7 dB. La ricezione in queste condizioni è stata 
analizzata nel corso del progetto FIFTH, traendo 
la conclusione che l'effetto Doppler è assente in 
quanto la ricezione è perpendicolare alla direzione 
del moto. In realtà il ricevitore raccoglie un'onda che 
si propaga sul cavo con una velocità che si somma/ 
sottrae a quella del treno, quindi lo shift dovuto 
all'effetto Doppler è presente. In appendice A sono 
riportati procedura e risultati di test di laboratorio 
eseguiti per approfondire questo aspetto. 

Fibra ottica 

La distribuzione in galleria degli m blocchi DVB-T 
richiede, in alternativa: 



Antenna 1 Antenna 2 
Antenna 5 S 



Fig. 4 - Distribuzione del segnale DVB/T a bordo treno utilizzando un cavo coassiale dedicato. 
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• un unico insieme di m modulatori DVB-T all'in¬ 
gresso della galleria, quindi una distribuzione 
del segnale (banda III) su fibra ottica "analogica", 
dedicata esclusivamente a questo servizio, 

oppure 

• la distribuzione del bitstream completo otte¬ 
nuto dalla ricezione satellite, su fibra "digitale", 
in eventuale condivisione con altri servizi, ai 
vari punti di alimentazione dei cavi fessurati. In 
questa ipotesi è necessaria, in ciascun punto,una 
batteria di m modulatori DVB-T. Se si opera que¬ 
sta scelta, dunque, si può risparmiare sulla fibra, 
ma i costi si moltiplicano a causa del numero di 
apparati installati. 

Distribuzione a bordo del treno 

Il segnale ricevuto (da satellite o da rete terrestre se 
in galleria), deve essere distribuito agli utenti, dotati 
di ricevitori DVB-T. 

Nell'ipotesi che sia presente un cavo coassiale dedi¬ 
cato, posato per la lunghezza del treno, accessibile 
su ogni carrozza, la situazione è quella indicata in 
figura 4. 

Il suddetto cavo viene utilizzato per distribuire il 
segnale fornito dal Tx DVB-T ad opportune antenne 
omnidirezionali posizionate sulle carrozze. 


Nel caso in cui non sia previsto/possibile un cablag¬ 
gio, si potrà considerare l'allestimento mostrato in 
figura 5. 

La struttura è sostanzialmente una serie di gap-filler 
in cascata. E'importante massimizzare la distanza 
tra l'antenna che riceve dal vagone prece¬ 
dente e l'antenna che trasmette verso gli utenti, 
come schematizzato in figura. Il segnale si degrada 
all'aumentare del numero dei gap-filler, tuttavia 
una struttura di questo tipo ha il vantaggio di non 
richiedere interconnessioni tra vagoni. 

Da notare che il singolo vagone non deve essere 
"ruotato di 180 gradi". 

5. Approccio "Time-Diversity" 

L'idea base è quella proposta nel progetto FIFTH, ov¬ 
vero permettere la copertura nelle gallerie tramite 
la doppia trasmissione del segnale con il medesimo 
ritardato di, ad esempio, 10 minuti. 

5.1 Requisiti del servizio 

Con questo approccio si perde la compatibilità con il 
segnale già presente su satellite (TivùSat). E'neces- 
sario dunque utilizzare un transponder dedicato, e 
questo comporta alti costi annui di utilizzo. I costi 
possono essere ridotti se si utilizza solo una parte 



Antenna 1 Antenna 2 
Antenna 5 S 



Fig. 5 - Distribuzione del segnale DVB/T a bordo treno, cavo coassiale dedicato non presente. 
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interruzioni recuperabili Galleria, percorsa in 6' interruzioni non recuperabili 



0' 10' 20' t 


© © © ® 

Fig. 6 - Schema di funzionamento dell'approccio Time Diversity. Il flusso dei dati è trasmesso dal satellite due volte: 
il secondo flusso, ritardato nell'esempio di 10 minuti, è quello distribuito, in condizioni normali, a bordo del treno. In 
caso di interruzioni (ostacoli brevi o gallerie più o meno lunghe) si utilizzano i dati ricevuti precedentemente, tra¬ 
smessi con il primo flusso e memorizzati in un buffer. In questo esempio alcune interruzioni occasionali (prima della 
galleria) causano errori recuperabili grazie ai dati presenti nel buffer, lo stesso accade per la mancanza di segnale du¬ 
rante il percorso in galleria, nell'esempio dura 6 minuti, mentre l'interruzione successiva, seppur breve, non può essere 
corretta poiché non può essere sostituito con il segnale relativo al primo flusso dati, mancante a causa della galleria. 


della capacità. Quindi l'offerta di programmi impat¬ 
ta direttamente sul costo. La qualità video inoltre è 
legata alla capacità del canale e quindi al costo. E' 
evidente l'importanza della decisione se distribuire, 
ad esempio, un segnale a 0,5 Mbit/s piuttosto che 
un segnale a 5 Mbit/s. 

5.2 Architettura di riferimento 

Vengono trasmessi, come già accennato, due flussi 
gemelli ma sfalsati di un certo tempo, supponiamo 
di 10 minuti. A bordo del treno il segnale fornito 
all'utente è quello ritardato. 

In caso di interruzioni (ostacoli brevi o anche gallerie 
più o meno lunghe) nel buffer di ricezione è comun¬ 
que presente la replica sfalsata del segnale che per¬ 
mette di ovviare alla mancanza di dati. Chiaramente 
il limite di funzionamento è di gallerie percorse in 
meno di 10 minuti, in caso contrario viene a mancare 
anche la diversity temporale. 


In figura 6 sono evidenziati i casi di errori occasio¬ 
nali, di mancanza del segnale (durante il percorso 
in galleria), e di errori occasionali nella condizione 
in cui il segnale di back-up sia mancante perché, 
nell'esempio, una precedente galleria lo ha corrotto. 

5.3 Aspetti realizzativi e criticità 

Questa soluzione richiede, come già detto, un tran- 
sponder dedicato. 

Poiché prevede la trasmissione di programmi codi¬ 
ficati ad-hoc'^°‘® occorre tenere conto di N encoder 
e del multiplexer. Non avendo altri vincoli è però 

Nota 1- Prelevare programmi già codificati per altri 
mux, in modo da risparmiare sul costo degli encoder 
non è consigliabile in quanto, normalmente, i mux 
sono statistici; estrarre e affasciare programmi prove¬ 
nienti da mux diversi comporta un bit rate con flut¬ 
tuazioni fuori controllo (a meno di non usare soluzioni 
tipo Cherry Picker, molto costose). 
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possibile e utile orientarsi verso schemi di modula¬ 
zione più efficienti rispetto a quelli previsti da DVB-S, 
come quelli previsti da DVB-S2 [5]. 

Come accennato del paragrafo precedente questo 
metodo soffre di una sorta di "effetto memoria" 
nei minuti successivi alle gallerie (e comunque a 
qualsiasi tipo di ostacolo). Inoltre, come analizzato 
in precedenza, lungo la linea ferroviaria sono pre¬ 
senti i tralicci di sostegno dei cavi di alimentazione 
che provocano delle microinterruzioni del segnale 
che costituiscono circa lo 0,3% del tempo totale. 
Di conseguenza, in un percorso privo di gallerie è 
alquanto improbabile che, a distanza di 10 minuti, 
entrambi i segnali siano corrotti simultaneamente. 
Ne consegue che in questo caso la diversity tempo¬ 
rale è efficace. Invece, in presenza di gallerie viene 
a mancare il segnale di backup e di conseguenza: 

• in galleria resta il solo segnale ritardato, pe¬ 
riodicamente corrotto dalla presenza delle 
microinterruzioni; 

• nei minuti successivi all'uscita dalla galleria 
viene a mancare il segnale di backup, e quello 
ricevuto è periodicamente corrotto dalla pre¬ 
senza delle microinterruzioni. 

Da quanto detto ne consegue che per garantire un 
servizio privo di malfunzionamenti così evidenti è 
necessaria la soluzione di diversity spaziale (an¬ 
tenna diversity). 

Downlink satellite 

Vale quanto già detto per la soluzione precedente, 
ma in questo caso, come accennato qui sopra, oc¬ 
corre l'antenna diversity. 

Galleria 

Vista la soluzione adottata non è più necessaria 
alcuna installazione per le gallerie. 

Distribuzione a bordo del treno 

Vale quanto già detto per la soluzione precedente. 


6. Ulteriori approcci 

La soluzione con antenna diversity, proposta per la 
ricezione DVB-S/S2 in presenza di microinterruzio¬ 
ni, è perfettamente funzionante dal punto di vista 
tecnico, ma risulta molto costosa in quanto su ogni 
treno il numero degli apparati di ricezione da satel¬ 
lite risulta praticamente raddoppiato. 

Sono concepibili soluzioni alternative anche basate 
su standard consolidati. 

6.1 Modulazioni con Time Interleaver 

Rimanendo nel novero degli standard già assestati 
appartenenti alla famiglia DVB, le possibilità sono 
due: DVB-H [6-8] e DVB-T2 [9-12]. Le implicazioni 
del loro utilizzo sono le seguenti: 

• entrambi gli standard non sono concepiti per la 
trasmissione su satellite. Dunque: 

• la banda del segnale è compatibile con la 
canalizzazione terrestre (tipicamente 8 MHz). 
Su trasponder satellitare per avere capacità 
adeguata occorre inserire tre di questi segnali. 
Quindi il transponder deve essere usato in 
modo SCPC (N segnali affiancati sullo stesso 
transponder), e con un certo faac/c-offaggiun- 
tivo (5 dB può essere un valore indicativo, da 
ottimizzare). Questo valore erode della stessa 
quantità il margine di ricezione. 

• il DVB-T2 ha prestazioni migliori rispetto al DVB- 
H, grazie ai codici LDPC, quindi è più indicato per 
recuperare il margine eroso dal back-off. 

• entrambi gli standard sono dotati di time- 
interleaver (Nota: Nel caso DVB-H, in realtà, si 
tratta di un FEC particolare con buffer di grandi 
dimensioni) capace di assorbire microinterruzio¬ 
ni di durata di molte decine di ms. Quindi sono 
più che adeguati per sopportare gli effetti dei 
traliccetti e altri brevi ostacoli, anche a velocità 
più basse. 

• apparati sono già disponibili commercialmente. 
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Fig. 7 - MPE-FEC nel DVB-FI. E' un codice correttore di 
errori a livello di protocollo IP che viene aggiunto allo 
scopo di migliorare la ricezione qualora il rapporto 
segnale/rumore C/N al ricevitore sia basso. Si noti che 
l'utilizzo di MPE-FEC è opzionale, cioè, la mancata 
implementazione della sua specifica nei terminali 
non pregiudica la possibilità di ricevere i dati corret¬ 
tamente (i pacchetti dati sono separati dai pacchetti 
di ridondanza con il FEC). Nelle situazioni in cui ci 
sia un'elevata perdita di pacchetti, possono essere 
introdotti pacchetti di ridondanza che permettono 
attraverso un algoritmo di interleaving e di protezione 
basato sul codice Reed Solomon (255,191,64): 255 
sono i byte totali, di cui 191 sono i dati relativi all'in¬ 
formazione utile e 64 i byte di parità per la protezione 
dagli errori. DVB-FI prevede diversi livelli di protezione: 
quanto più essi sono efficaci in termini di protezione 
ai disturbi tanto più basso è il bit rate utile e di conse¬ 
guenza il numero di programmi trasmissibili. Come si 
vede, per creare i byte di ridondanza Reed Solomon, 
i pacchetti di dati vengono disposti lungo le colonne 
della tabella, uno di seguito all'altro. Se tutte le colon¬ 
ne di dati e tutte le colonne di FEC vengono riempite, 
si ottiene una ridondanza del 25% circa (con un code 
rate di %). Se al posto delle ultime colonne di dati 
vengono inseriti dei byte fittizi [padding) si ottiene 
praticamente un aumento della ridondanza (in quanto 
il padding non viene trasmesso e il codice di correzio¬ 
ne lavora quindi su un numero minore di dati). È utile 
notare che la tabella descritta ha un numero massimo 
di 1024 righe, il ché limita la grandezza massima della 
tabella di MPE-FEC a 2 Mbit circa. Un controllo di 
parità aggiuntivo CRC-32 permette di rilevare se i dati 
ricevuti sono affetti o meno da errori residui. 


6.2 Approccio "Upper Layer FEC" 

La tecnica alternativa analizzata in questa sezio- 
consiste nell'introduzione di un Time Interleaver e 
relativo Upper Layer FEC. 

L'aspetto fondamentale delle microinterruzioni è 
che il duty cycle risulta particolarmente basso (2 
ms di interruzione, e quindi di bit errati, a fronte di 
600 ms di segnale corretto, ovvero circa lo 0,3%). 
Nell'ipotesi di prima approssimazione in cui il ri¬ 
cevitore dia origine ad un burst di errori in uscita 
di durata paragonabile, il tasso di errore medio 
risulta essere a questo livello dell'ordine di 10 ^ che 
un decodficatore FEC può facilmente recuperare. 
Poiché tali decodificatori funzionano bene se gli 
errori presenti nel flusso dati al loro ingresso non 
sono a burst, ma risultano distribuiti nel tempo, è 
necessario inserire anche un Time Interleaving. 

Per minimizzare i costi: 

• è desiderabile utilizzare la trasmissione via satel¬ 
lite utilizzando (quindi pagando) solo una parte 
della capacità del transponder; 

• è indispensabile riutilizzare tecnologie già 
disponibili, quindi l'analisi è orientata agli stan¬ 
dard che già mettono a disposizione le caratteri¬ 
stiche sopra citate, riducendo così i tempi entro 
cui gli apparati sono disponibili; 

• utilizzare dei bit rate moderati (ad esempio 500 
kbit/s per programma, sufficiente per ottenere 
una buona qualità video su schermi di 10"-15", 
utilizzando una codifica AVC) 

Il primo punto suggerisce di utilizzare la modula¬ 
zione DVB-S. 

Per quanto riguarda il secondo punto di tutti gli 
standard della famiglia DVB l'unico che prevede 
un Upper Layer FEC separabile dal modulatore è il 
DVB-H [6-8]. Tale standard prevede un incapsulatore 
IP su TS che introduce un FEC/Interleaver chiamato 
MPE-FEC che permette di fornire maggiore prote¬ 
zione in caso di trasmissione difficoltosa (figura 7). 
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6.2.1 Aspetti realizzativi e criticità 
Head-End 


posilo software di codifica: il costo è quindi inferiore 
ad un encoder hardware. 


Lo schema a blocchi di riferimento è quello di figura 
8. 

Ciascun programma necessita di un encoder A/V. 
Essendo quella analizzata una soluzione svincolata 
da piattaforme precedentemente esistenti è ipo¬ 
tizzabile utilizzare codifiche avanzate (ad esempio 
AVC) per ottenere un'efficienza maggiore e riuscire 
così a "comprimere" i programmi previsti in un bit 
rate minore risparmiando così sul costo del satellite. 

Ciascun encoder, visti i bassi bit rate ipotizzati per 
questa soluzione, può essere un server con un ap- 


II TimeDivision Processore una macchina basata su 
software che permette di produrre per ogni pro¬ 
gramma in ingresso la sua copia ritardata. 

Il DVB-H IP Encapsulator è una macchina commer¬ 
cialmente reperibile che inserisce a livello di ogni 
singolo programma l'Upper Layer FEC secondo lo 
standard DVB-H. L'uscita è un ASI-TS che può essere 
multiplexata con altri servizi esterni in modo da 
ridurre le spese del satellite. 

L'uscita del multiplexer va al modulatore DVB-S per 
generare il segnale per l'up link. 



Deinterleaver 


e decoder 
MPE-FEC 



Processore 

Time-Diversity 


Server 
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Streamer 

Video 


Hard-disk 



Access 
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Fig. 9 - Schema a blocchi 
degli apparati a bordo treno. 
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Downlink satellite 

Valgono le considerazioni riportate nella sezione 
4.3.1. Per quanto riguarda il BlockingeShadowing 
dovuto a ostacoli, l'Upper Layer FEC permette di 
andare ben oltre il valore di 20 ps per la massima 
durata dell'interruzione valutato nell'ambito delle 
prove riportate in Appendice A. 

Distribuzione a bordo del treno 

Per ridurre i costi, una alternativa alla distribuzione 
DVB-T precedentemente analizzata, si può ipotiz¬ 
zare che gli utenti siano dotati di terminale con 
connessione WiFi (notebook, netbook, tablet) e 
quindi prevedere di utilizzare la distribuzione WiFi, 
già prevista sui treni di prossima realizzazione. 

Lo schema a blocchi degli apparati a bordo treno è 
quello indicato in figura 9. 

Il segnale da satellite è ricevuto mediante antenna 
motorizzata dotata di puntamento e tracking auto¬ 
matico. Il TS deve essere opportunamente proces¬ 
sato mediante un apparato basato su computer che 
dovrà occuparsi di: 

• operare il deinterleaver ed MPE-FEC; 

• ricostruire le parti di segnali corrotte mediante 
il meccanismo della doppia trasmissione; 

• rendere disponibili i programmi così ottenuti, 
in streaming. 

Il flusso IP può essere mandato all'Access Point già 
presente sul treno insieme all'altro traffico IP per la 
trasmissione WiFi nelle carrozze. 

Prove di laboratorio 

Sono riportate in appendice B. 

6.3 Alternativa minimalista 

Un approccio di ripiego è quello di fornire all'utente 
un numero ridottissimo di programmi live e inte¬ 
grare l'offerta con materiale registrato su un video 
server posizionato a bordo del treno. 

Tuttavia l'obiettivo inderogabile di offrire program¬ 
mi live preclude questa possibilità. 


7. Conclusioni 

Lo studio ha analizzato diversi approcci per consen¬ 
tire la distribuzione dei programmi di TV digitale a 
bordo dei treni ad alta velocità. 

Utilizzando per la distribuzione via satellite lo 
standard DVB-S si è visto che la durata massima 
delle microinterruzioni non deve eccedere i 20 ps; 
la durata stimata delle microinterruzioni dovute ai 
traliccetti è di 2 ms (100 volte superiore rispetto 
a quanto ottenibile con il DVB-S). Utilizzando lo 
standard DVB-S2 si ottengono dei risultati migliori 
ma non ancora sufficienti per garantire una buona 
copertura con ricezione a singola antenna. 

I primi due approcci descritti (sezioni 4 e 5) sono 
basati sulla ricezione satellitare e richiedono l'ado¬ 
zione dell'antenna diversity (due antenne riceventi), 
la rimodulazione e la trasmissione DVB-T attraverso 
cavo fessurato lungo le gallerie. Sono quindi carat¬ 
terizzati da elevati costi di investimento. 

Benché questo sia un documento tecnico, alcune 
scelte, per quanto tecnologicamente interessanti 
e con buone probabilità di successo, potrebbero 
compromettere la fattibilità del progetto a causa 
dei costi e della loro distribuzione nel tempo. Nello 
specifico per avere il servizio su una tratta (ad esem¬ 
pio Roma-Milano-Torino) è indispensabile coprire 
tutte le gallerie e questo richiede un investimento 
immediato. 

L'allestimento dei treni per quanto possa essere 
in parte diluito nel tempo è anche suscettibile di 
semplificazioni e conseguenti riduzione di costi. 

Per ridurre i costi, pur risolvendo il problema delle 
microinterruzioni, si è analizzata un'alternativa che 
consiste l'introduzione di in Time Interleaver e re¬ 
lativo Upper Layer FEC (sezione 6.2). 

Questa alternativa può essere vantaggiosa dal pun¬ 
to di vista economico ed è stato quindi approfondito 
tramite alcuni test di laboratorio al fine di analizzare 
alcuni aspetti relativi all'efficacia del sistema in pre¬ 
senza di microinterruzioni. 

In figura 10 sono schematizzati i principali vantaggi 
e svantaggi degli approcci considerati e di seguito 


42 


Elettronica e Telecomunicazioni N° 2 Agosto 2011 


www.crit.rai.it 




Approccio "Bouquet esistente" 

© Riutilizzo dei TransponderTiVuSat 

© Copertura a cielo aperto mediante antenna con tra- 
cking automatico 

© Distribuzione in galleria mediante DVB-T: il segnale 
viene prelevato ad esterno galleria, modulato e diffu¬ 
so su cavo fessurato 

© Antenna: la soluzione a tracking automatico esiste in 
commercio ma è costosa 

© Effetto Doppler, relativo al solo segnale diretto, per il 
movimento reciproco tra satellite e treno. 

© Blocking e Shadowing dovuto a ostacoli: le prove di la¬ 
boratorio dimostrano che ostacoli piccoli ma periodici 
possono causare problemi 




© Soluzione a singola antenna non praticabile 
© Antenna diversity: costo eccessivo 


sono riassunti i principali vantaggi e svantaggi di 
questo approccio: 


Approccio "Time diversity" 

© Vengono trasmessi due flussi gemelli sfalsati di 
un certo tempo, es. 10 minuti. A bordo del treno 
il segnale fornito all'utente è quello ritardato. In 
caso di interruzioni nel buffer di ricezione è co¬ 
munque presente la replica sfalsata del segnale 
che permette di ovviare alla mancanza di dati. 

© Non è necessario l'allestimento delle gallerie 

© Interruzioni maggiori del tempo di ritardo non 
vengono recuperate. 

© "Effetto memoria": degrada gravemente il servizio 



Approccio "UpperLayer FEC -i-Time-Diversity" 

© Vengono trasmessi due flussi gemelli sfalsati 
di un certo tempo, es. 10 minuti. 

© In caso di interruzioni nel buffer di ricezione 
è comunque presente la replica sfalsata del 
segnale che permette di ovviare alla man¬ 
canza di dati. 

© Il segnale trasmesso viene protetto da un ul¬ 
teriore layer superiore con FEC e time interle- 
aving: in ricezione quindi le microinterruzioni 
da catenaria e ponti vengono sanate prima 
del diversity switch. Quest'ultimo si trova ad 
operare senza "effetto memoria". 


VANTAGGI: 

© Non è necessario rallestimento delle gallerie. Se 
si utilizzassero le soluzioni alternative sarebbe 
invece necessario allestire anche le gallerie più 
corte (ad esempio quelle di lunghezza inferiore 
ai 100 m) per evitare evidenti problemi al segna¬ 
le video. 

© La sosta in stazioni intermedie di durata inferiore 
ai 10 minuti viene gestita come per le gallerie. E' 
quindi possibile un risparmio per l'adeguamen¬ 
to delle stazioni al servizio. 

©Non è necessaria la seconda antenna satel¬ 
litare (e relativo commutatore a diversity) 
su ogni treno; questo riduce notevolmente i 
costi dell'hardware e relativa installazione. Il 
cablaggio è anche notevolmente semplificato, 
specialmente rispetto alla soluzione con le due 
antenne installate in testa e in coda del treno. 

© Non è necessaria la componentistica trasmitten¬ 
te DVB-T a bordo, né l'utilizzo di chiavette per la 


© Non è necessario l'allestimento delle gallerie 

© richiede (parte di) un transponder satellitare 
dedicato. 


Fig. 10 - Principali vantaggi e svantaggi degli 
approcci considerati. 

ricezione, grazie all'approccio WiFi, che già sarà 
presente sui treni per l'accesso a Internet. Tra 
l'altro questo approccio permette una migliore 
e più semplice integrazione dei servizi Radio-TV 
in streaming all'interno di un "portalino" a cui 
l'utente a bordo del treno si può connettere 
come interfaccia verso l'esterno. Della capaci¬ 
tà del WiFi (ad esempio 54 Mbit/s) una quota 
corrispondente alla banda massima di accesso 
internet (8 Mbit/s, come ipotesi) potrebbe essere 
utilizzata in esclusiva per l'accesso a Internet 
(prevedendo un firewall per bloccare streaming 
da siti esterni) rendendo disponibile la restante 
capacità per lo streaming di bordo (TV e conte¬ 
nuti video locali). 
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SVANTAGGI 

@ E'necessario (parte di) un transponder satellitare 
dedicato. Il costo potrebbe essere mitigato con 
i seguenti espedienti: 

• utilizzando satelliti "poco pregiati", quelli 
che non si trovano sulle posizioni orbitali 
più utilizzate (13 e 19.2 Est). 

• utilizzando solo parte della capacità (parte 
del MUX digitale), in coesistenza con altri 
servizi/utenti. Ciò grazie al fatto che si usa 
la modulazione (DVB-S) e i parametri più 
diffusi per il servizio satellitare. 

©E'necessario un HeadEnd apposito.Tuttavia è 
ipotizzabile utilizzare codifìche avanzate (AVC) 
per ottenere un'efficienza maggiore e riuscire 
così a "comprimere" i programmi previsti in un 
bit rate minore risparmiando così sul costo del 
satellite. Ciascun encoder dunque può essere 
un server con un apposito software di codifica: il 
costo è quindi inferiore ad un encoder hardware. 


Lo studio realizzato ha consentito di verificare la 
fattibilità tecnologica, di stimare i costi e di indivi¬ 
duare le principali problematiche realizzative ed 
infrastrutturali. 

I risultati dello studio hanno consentito inoltre di 
formulare una proposta di massima da sottoporre 
ai potenziali clienti sia in Italia che all'estero. 

I riscontri ottenuti da parte dei potenziali clienti 
sono stati positivi anche se, sul mercato italiano, 
non è prevista un'applicazione nei prossimi due / 
tre anni. 
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Appendice A 

Al . Test preliminari di laboratorio 

Si è inteso approfondire alcuni aspetti relativi alla 
ricezione del segnale satellite/terrestre in ambiente 
"difficile": in particolare l'effetto delle microinter¬ 
ruzioni dovute ai tralicci di alimentazione sulla 
ricezione satellitare, e l'effetto del Doppler shift in 
galleria sulla ricezione DVB-T. 

A 1.1 Effetti delle microinterruzioni 
SULLA RICEZIONE DVB-S/DVB-S2 

Nella figura Al è rappresentata la tipica situazione a 
cui si deve fare fronte: le linee aeree di alimentazione 
del treno sono sospese a traliccetti metallici di 20 
cm circa di sezione. La tipica campata è di 53 m, ma 
in curva e nelle zone ventose può essere più corta. 

Alla velocità di 300 km/h i traliccetti provocano uno 
shadowing/blocking di durata dell'ordine di 2 ms. 


Il periodo di ripetizione dell'evento è di circa 0,6 
secondi. Chiaramente a velocità più basse la durata 
del blocking aumenterà di conseguenza, seppure 
con periodicità più rarefatta. 

In figura A2 è riportata l'attenuazione risultante 
da transito sotto il traliccetto, come riportato nei 
documenti del progetto FIFTH. Come si può notare 
l'attenuazione sale a 15^20 dB. Considerato che a 
cielo chiaro il margine di ricezione dovrebbe essere 
di circa 7 dB (come da dati forniti dai costruttori 
dell'antenna), il passaggio sotto il traliccetto si tra¬ 
duce in una interruzione del segnale ricevuto. 

Scopo dell'indagine di laboratorio è verificare se 
tale interruzione ha come conseguenza un effetto 
evidente sull'immagine, e comunque determinare 
quale è la durata massima della microinterruzione 
che non causa problemi a video. 

Per testare l'effetto delle microinterruzioni sul se¬ 
gnale satellitare, è stato utilizzato il banco in figura 
A3. 


Velocità massima del treno —>- 

v=s/t=300 km/h = 83,3 m/s 








600 ms 








-► 


2 ms tempo 

■<—► 


Fig. Al - Microinterruzioni dovute ai traliccetti di supporto delle linee di alimentazione. 
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Attenuazione relativa ad un ostacolo largo 0,4 m nella banda 


Fig. A2 - Attenuazione del segnale 
ricevuto da satellite durante il 
transito sotto i traliccetti. I valori 
miurati sono utilizzabili anche nel 
caso di ostacoli quali i traliccetti 
presi in considerazione nelle pro¬ 
ve di laboratorio. 


-2.5 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5 

h [m] 





Fig. A3 - Schema di laboratorio per la verifica dell'effetto delle microinterruzioni 
sulla ricezione satellitare. Il tronsportstream di prova contiene un servizio A/V a 5 
Mbit/s è fornito dalla sorgente ASI (a) al modulatore DVB-S (Newtec NTC2277, b). 

Il segnale è modulato a 70 MFIz e quindi inviato al simulatore di microinterruzioni, 
che è costituito da un modulatore a diodi PIN (FIPIlfióSB, c), in grado di attenuare 
a comando elettrico il segnale RF, mandandolo sotto soglia. Il comando viene otte¬ 
nuto da un generatore di impulsi (FIP8007B, d) . I parametri dell'impulso sono com¬ 
pletamente controllabili da pannello frontale. Il segnale così ottenuto è convertito 
in frequenza a 1 GFIz ed inviato al ricevitore DVB-S/DVB-S2 (Newtec NTC2280, e). 

Il transportstream è inviato ad un decoder A/V (Tandberg RX1290, f ); l'immagine 
è visibile su un monitor (g). Un oscilloscopio digitale (h) permette di visualizzare il 
segnale di controllo e quindi misurare i parametri dell'impulso. 
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Risultati delle prove: DVB-S 

L'utilizzo del DVB-S è previsto nel caso in cui si voglia 
ricevere i segnali satellitari mediante la piattaforma 
TivùSat. In questo caso il bit rate utile dei transpon- 
der normalmente impiegati è di 33.79 Mbit/s dal 
momento che vengono utilizzati i seguenti para¬ 
metri di modulazione: 

• Symbol Rate= 27,5 Msymb/s 


Si è inoltre constatato che il massimo T. non 

interruzione 

dipende dal code rate adottato. 

In particolare in R=1/2, a R^=5 Mbit/s il FECframe 
dura 

TFECframe=64800*\. =64800/(2*5E6)= 6,5 ms. 

Con R=1/2, il FEC dovrebbe in teoria recuperare fino 
a circa 50% di bit errati, quindi fino a 6,5/2 = 3,25 ms. 


• Costellazione= QPSK 
. FEC=2/3 

il modulatore è stato conseguentemente impostato 
nel medesimo modo e si è misurata qual'è la massi¬ 
ma durata dell'interruzione tollerabile dal sistema 
senza dare origine a errori visibili a video. Come 
risultato si ha: 


T. 


, < 20 ps 


Si noti come la durata massima dell'interruzione sia 
100 volte inferiore rispetto alla durata dell'interru¬ 
zione dovuta ai traliccetti. 


Risultati delle prove: DVB-S2 

Nel caso in cui non si dovesse utilizzare la ricezione 
TivùSat, è possibile adottare modulazioni (standard 
0 non) più efficienti: si è testato il caso DVB-S2. 

Inoltre, giocando sul Symbol Rate, è possibile ren¬ 
dere il sistema più robusto, sacrificando la capacità. 

• Symbol Rate= 5,2 Msymb/s 
. ModCod=QPSK;R=1/2 
. R = 5 Mb/s 

u 

T., < 1 ms 

interruzione 

Si può estrapolare che, con un Symbol Rate dieci 
volte inferiore, R= 0,5 Msymb/s, e il medesimo 


ModCod, il massimo per T. 
superiore, quindi: 


interruzione 


sia dieci volte 


T. < 10 ms 

interruzione 


Datocheal massimoT.. < 1 ms, si conclude che 

il FEC non lavora nelle condizioni ottimali. Si può 
ipotizzare che il motivo stia nel fatto che gli errori 
arrivano a burst (salve di errori), e il guadagno del 
codice risulti di conseguenza "saturato" già a bassi 
code rates. 

A2 Effetti del Doppler shift nella 

RICEZIONE DVB-T DA LINEA FESSURATA 

Come accennato, il segnale in galleria verrebbe 
diffuso utilizzando un cavo coassiale fessurato (già 
presente), che si comporta come sorgente distri¬ 
buita di segnale RF. Per evitare perdite eccessive, il 
cavo è predisposto in doppi segmenti, 550-1-550 m, 
alimentati al centro. La situazione quindi è quella 
rappresentata in figura A4. 

In basso è schematizzato il sistema di cavi, in alto il 
grafico che rappresenta l'andamento (normalizzato) 
del segnale ricevuto. Da dati preliminari comunicati 
a Rai Way, la fluttuazione di livellosi aggirerebbe sui 
7 dB. Il Dopplershift, come già accennato, dovrebbe 
essere caratterizzato da due valori, uno positivo e 
uno negativo, dovuti al verso discorde/concorde di 
propagazione dell'onda sul cavo rispetto al verso di 
movimento del treno. 

Inoltre, in ogni singolo tratto (figura A5), il segnale 
ottenuto all'antenna ricevente è la sovrapposizione 
di infiniti contributi, ciascuno proveniente da un 
tratto infinitesimo di linea, e pesato in fase dal diffe¬ 
rente cammino ottico, e in ampiezza dalla differente 
attenuazione di tratta (distanza tra tratto di linea e 
antenna ricevente). 


Ovviamente il bit rate utile sarà un decimo: R^= 0,5 
Mbit/s. 


In buona sostanza, il contributo più robusto è quello 
più vicino, dunque perpendicolare alla linea. Un 
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certo intorno di tale punto fornisce ancora un con¬ 
tributo significativo, ma via via decrescente e poi 
trascurabile. Un modello raffinato prevederebbe 
quindi che il segnale ricevuto sia l'integrale di tutti 
i contributi, pesati in modulo e fase come sopra de¬ 
scritto. Allo scopo di semplificare i calcoli abbiamo 
invece considerato un modello approssimato, che 
riteniamo sufficientemente rappresentativo della 
realtà, in cui tutti i contributi sono concentrati in una 
sorgente di tipo puntiforme. Inoltre, si è approssi¬ 
mato il cammino ottico del segnale considerando il 
tratto AC come equivalente alla somma AB-i-BC. Se 
AB è grande (Rx lontano dal punto di alimentazione) 
questo è sicuramente una buona approssimazione. 
In caso contrario l'errore introdotto è, nel caso spe¬ 
cifico in cui BC=2 m circa eX=1,25 m, non eccessivo. 

il Doppiar shift che ne risulta è dunque: 

^ ^ v-cos(a) /o -v , , d .. 

fD=fo -=- cos{arctg{ -)) 

c c v-t 


Dove: è la frequenza di trasmissione (220 MHz), v 
è la velocità del treno (300 km/h = 83 m/s), d=BC = 
2 m, c è la velocità della luce (3-10® m/s), t è il tempo. 

Questo profilo di canale è stato generato con Matlab 
e il file caricato sul simulatore di canale. 

Per testare l'effetto del Doppler shift sulla ricezione 
DVB-T in galleria, è stato utilizzato il banco di misura 
illustrato in figura A6. 

Il risultato è riportato in figura A7, in cui è visibile lo 
spettrogramma del segnale, ovvero il diagramma 
relativo all'evoluzione temporale del contenuto 
spettrale del segnale. 

E'facile notare che il segnale (portante non modu¬ 
lata, in questo caso), subisce una brusca variazione 
di frequenza, da circa -i-60 Hz a circa -60 Hz rispetto 
al valore nominale, nel momento in cui si simula il 
passaggio del treno a cavallo del punto di alimen¬ 
tazione dei due tronconi di cavo fessurato. Analogo 


Fig. A4 - Andamento del 
segnale nel cavo coassiale 
fessurato in galleria. 



w* -w w* 



A VV*" 


B 



Fig. A5 - Dettaglio dell'anda¬ 
mento del segnale nel cavo 
coassiale fessurato in galleria, 
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comportamento (qui non visualizzato), 
con frequenze invertite, si ha nella tran¬ 
sizione tra due tratti da 1100 m. 

Il valore -vi- 601-lz è il Doppler shift pre¬ 
visto, in banda III (230 MHz) a velocità di 
240 km/h (massima velocità permessa al 
treno in galleria). 

Avendo dunque validato il profilo di ca¬ 
nale e il set-up di misura, si è proceduto 
alle prove vere e proprie. La modalità di 
esecuzione è stata la seguente: 

• Impostare la modulazione desidera¬ 
ta, partendo da quella più robusta 
(QPSK, R=1/2,FFT=2k) 

• Aggiungere rumore gaussiano bian¬ 
co; decrementare il C/N fino a rag¬ 
giungere la soglia di visibilità degli 
errori a video 


TRACE A: Chi Spectru» 

A Marker 121.95 s 474 003 949.94 Hz -122.872 dBm 



Fig. A7 - Spettrogramma del segnale clean carrier affetto da 
Doppler shiftAn ascissa è la frequenza, in ordinata il tempo 
(in basso il più recente), e in scala di colori il livello, funzione 
di tempo e frequenza. 







Fig. A6 - Schema di laboratorio per la verifica dell'effetto Doppler sulla ricezione DVB-T. 

Il transport stream di prova fornito dalla sorgente (a) al modulatore DVB-T (PTV5780, b) 
contiene un servizio A/V a 5 Mbps. Il segnale modulato in banda III è inviato al simulato 
re di canale (Elektrobit Propsim C2, c), su cui è stato caricato il profilo di canale ottenuto 
tramite simulazione Matlab. Il segnale così ottenuto, sempre in banda III, è ricevuto da 
un TV integrato DVB-T (d) .Prima delle prove, il set-up è validato togliendo modulazione 
sul Modulatore DVB-T (clean carrier mod)e) e visualizzando il segnale a valle del simula¬ 
tore tramite un analizzatore di spettro vettoriale (HP89441, e). 
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• Incrementare il C/N così trovato di un valore 
predefinito di margine (1 dB) 

• Attivare la simulazione di canale con Doppler 

• Verificare corretta ricezione, specialmente nel 
momento di transizione (massimo Doppler) 

• Passare alla prossima modulazione (ripetere 
test) 

Risultati delle prove 

il sistema di trasmissione DVB-T si è dimostrato 
insensibile alla transizione Doppler simulata, entro 
il margine previsto, non solo per i modi più robusti, 
ma anche per i modi meno indicati per la ricezione 
mobile. 

Il multipath fading non è stato simulato. Tuttavia si 
può ritenere che le riflessioni provenienti dalle pa¬ 
reti della galleria e dal treno stesso diano contributo 
trascurabile rispetto al segnale diretto. 


Appendice B 

B1. Prove di laboratorio sulla catena DVB-H 

Allo scopo di validare l'ipotesi presentata in questo 
articolo sono stati effettuati dei test di laboratorio 
utilizzando la catena DVB-H Nokia attualmente in 
uso presso il Centro Ricerche Rai. 

Il set-up del banco di laboratorio è riportato in 
figura B1. 

Purtroppo, a causa dell'utilizzo della catena DVB-H 
per altre sperimentazioni in corso presso il Centro 
Ricerche, non è stato possibile modificare i para¬ 
metri del flussoTS generato dall'incapsulatore. Si è 
dovuto quindi impiegare un MPE-FEC con rate 5/6 e 
soprattutto non si è potuto escludere il TimeSlicing 
che prevede la trasmissione a burst dei programmi 
allo scopo di risparmiare la batteria del terminale 
mobile (figura B2). 



t 

DVB-H 
TS: Net 1 Mbps, 

Time Slicing, 
MPE-FEC 5/6 - 





Fig. B1 - Schema a blocchi del banco di misura dei test di laboratorio. Il tran sport stream generato dalla catena DVB-H 
(a), che già include l'incapsulatore con Interleaver ed MPE-FEC, viene modulato mediante modulatore DVB-S (Newtec 
NTC2277,b) utilizzando la tipica configurazione impiegata per i servizi broadcast (QPSK, 2/3, SR= 27,5 MS/s, 33,79 
Mbit/s). Il segnale a 70 MHz è quindi inviato al simulatore di microinterruzioni, che è costituito da un modulatore a 
diodi PIN (HP11665B, c), che è in grado di attenuare a comando elettrico il segnale RE, mandandolo sotto soglia. Il 
comando viene ottenuto da un generatore di impulsi (HP8007B, d). I parametri dell'impulso sono completamente 
controllabili da pannello frontale. Mediante un Noise & InterferenceTest Set (HP3708A, e) si somma rumore gaussiano 
bianco in modo da ottenere le medesime condizioni di ricezione previste a bordo treno (7 dB di margine). Il segnale 
così ottenuto è convertito in frequenza a IGHz ed inviato al ricevitore DVB-S (Newtec NTC2280, f). A questo punto, 
allo scopo di poter visualizzare il programma mediante un ricevitore DVB-H dotato di MPE-FEC decoder (g), si è inseri¬ 
to un modulatore DVB-H (Screen Service, h). La tratta radio, essendo molto breve, si può assumere priva di errori. 
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La presenza del TimeSlicing può essere molto dele¬ 
teria in quanto il burst di errori potrebbe cadere pro¬ 
prio in corrispondenza dello slice del programma 
ricevuto rendendo il sistema molto meno protetto di 
quanto potrebbe essere se il bit rate fosse costante. 

Le microinterruzioni generate con il banco descritto 
sono del tipo riportato in figura B3; i valori utilizzati 
durante le prove sono desunti dal progetto FIFTH. 

In tabella B1 sono riportati i risultati ottenuti. 

Come si può osservare, al netto di qualche sporadico 
errore'^°* * ** =®' per la situazione a 150 km/h, i risultati 
sono molto promettenti, tenendo conto del rate 
dell'MPE-FEC non certo ottimale e della presenza 
del Time Slicing. 


Nota B1 - La presenza di questi errori non è stata 
spiegata con certezza, ma con buona probabilità 
è dovuta alla concomitanza della periodicità delle 
slices con la periodicità delle microinterruzioni. 
Nella realtà, senza il TimeSlicing, è prevedibile che 
questa anomalia scompaia. 


200 ms 1s 

■<—-► 

At 

< -► 



Fig. B2 -Time slicing nel DVB-H. 


Non sono stati esplorati altri casi, perché la confi¬ 
gurazione dell'MPE-FEC è del tutto sub-ottima, e 
si rimandano ulteriori indagini a quando si potrà 
riconfigurare il sistema. 

Le prestazioni possono essere quindi anche di 
molto superiori a quanto riportato nella tabella. Se 
ciò fosse verificato, renderebbe possibile l'assorbi¬ 
mento da parte del FEC degli effetti di ostacoli di 
estensione maggiore. 


b 0 



-► 

tempo 


Fig. B3 -Timing delle microinterruzioni. 


Velocità 

[km/h] 

T* 

[ms] 

[ms] 

Risultato 
del test 

Note 

300 

600 

2 

OK 


150 

1200 

4 

OK 

Errori occasionali 

75 

2400 

8 

OK 


37 

4800 

16 

OK 


19 

9600 

32 

OK 



Tab. B1 - Risultati del test. 


* periodicità dei traliccetti 
alla velocità indicata con¬ 
siderando una distanza 
tipica di 53 m 

** durata delle microin¬ 
terruzioni alla velocità 
indicata considerando 
uno spessore tipico dei 
traliccetti di 20 cm 
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